«Адаптировали процесс анализа данных под непрофессиональных пользователей»
Владельцы компании Statzilla («Статзилла») Екатерина Власенко и Святослав Заруцкий, специалисты по обработке и анализу данных, заключили соглашение об интеграции своего программного продукта в платформу Региональной объединенной системы медицинской информатизации (ROSMED.INFO) — крупнейшего в России оператора на рынке медицинских информационных баз.
Фото Михаила Мальцева. Разработка ростовских предпринимателей Екатерины Власенко и Святослава Заруцкого единственная в мире позволяет не только произвести математический анализ данных, в том числе связанных с течением болезни и эффективностью способов лечения, но и получить текстовое описание полученных результатов. Интеграция в платформу ROSMED.INFO поможет «Статзилле» выйти на федеральную аудиторию практикующих врачей, ученых-медиков и фармацевтов.
N: — Рынок обработки массивов данных малообжитым не назовешь. Почему именно вас пригласил к сотрудничеству крупнейший отечественный игрок медицинского сегмента Big Data? Е.В.: — На этом рынке действительно немало участников, в том числе крупных, с прекрасной репутацией и огромным опытом. Тем не менее наш сервис online.statzilla.ru умеет то, чего не умеет ни один из наших матерых конкурентов, включая такие программные пакеты, как Statistica компании Dell и Statistical Package for the Social Sciences — SPSS, который принадлежит IBM. Дело в том, что продукты конкурентов подразумевают довольно высокий уровень математических знаний у пользователя. На начальном этапе исследования это означает, к примеру, что вам придется самому выбирать метод обработки данных (что в случае ошибочного выбора обесценит результаты), а на финальном — что программа выдаст результат в виде голых таблиц, которые придется как-то интерпретировать.
Еще до образования «Статзиллы» к нам довольно часто обращались клиенты, которые приносили кипы таблиц со словами: «Помогите разобраться, что это такое». Тогда и возникло понимание, в каком направлении следует развивать свое дело.
С.З.: — Мы адаптировали процесс работы с массивами данных под непрофессиональных пользователей — исследователей, предпринимателей — и довели его до фазы, в которой заказчик получает на выходе помимо цифр, сведенных в таблицы и графики, понятную ему описательную часть. Работает это просто: Statzilla через web-интерфейс получает данные от клиента, не разбирающегося в тонкостях теории вероятности и принципах обработки статданных, и, последовательно задавая вопросы на понятном ему языке, позволяет не только осмысленно выбрать метод анализа исходной информации, но и генерирует на выходе текст, который может включать в себя, например, заключение по предрасположенности пациента или группы пациентов к той или иной болезни, ссылки на научные работы, аргументирующие выводы и прогнозы, и многое другое.
Е.В.: — Наше партнерство с «Росмединфо» — первый в России проект (да и в мире), объединяющий на одной платформе все инструменты для проведения медицинского исследования врачом самостоятельно в рамках всех необходимых процедур и нормативов, от соблюдения законодательства по сбору, хранению и доступу к персональным данным до корректной обработки и статистического анализа собранного материала.
Точно так же сервис «Статзиллы» действует и при решении бизнес-задач. Для бизнеса мы реализуем в основном проекты по прогнозированию ключевых показателей, исследованию поведения потребителей, оптимизации бизнес-процессов — одним словом, извлекаем пользу из сырых массивов данных.
N: — Но вернемся к партнерству с «Росмединфо». Как оно возникло? Е.В.: — Мы встретились с представителями компании на медицинской конференции в Волгограде в конце апреля. Оказалось, на тот момент в «Росмединфо» пришли к пониманию ровно того же: программы обработки статданных должны быть адаптированы под непрофессионального пользователя. Они искали, но не нашли на российском рынке компании, которые успели решить эту задачу, и уже собирались заказывать разработку программного продукта с нуля, но тут встретили нас.
N: — На кого рассчитаны предлагаемые вами — теперь и совместно с «Росмединфо» — услуги? С.З.: — На всех, кто занят сбором и обработкой данных для медицинских исследований на самых разных уровнях: практикующие врачи, ученые, медицинские сообщества, НИИ, госструктуры. Наиболее важны — с точки зрения возможности проведения глубокого репрезентативного анализа и получения ценных выводов — объемные многоцентровые исследования.
Сегодня без использования баз «Росмединфо» провести такие исследования по рассматриваемым вопросам достаточно сложно. Прежде всего, в связи с тем, что сформировать самостоятельно в пределах лечебного отделения или больницы качественную, достаточно формализованную базу данных по историям болезней крайне трудозатратно. Да, в большинстве клиник ведение историй компьютеризировано. Но на практике сталкиваешься с тем, что один врач внес нужные для исследования показатели в одно поле, а другой — в другое, один врач, ставя диагноз, использовал одну терминологию, другой — другую. На платформе «Росмединфо» процесс внесения информации о пациенте детально формализован, что помогает избежать этих проблем.
Компания ведет так называемые регистры пациентов — это онлайн базы данных о пациентах, их заболеваниях, произведенной диагностике и лечении в рамках ежедневной практики врача. Однако ранее сама платформа подразумевала только ввод, хранение, предоставление доступа и возможность выгрузки данных с минимальным расчетом средних значений, но без оценки статистической значимости (если сказать проще — без оценки надежности) результатов. После интеграции с сервисом Statzilla пользователям регистров будут доступны современные методы анализа в рафинированном виде: несколько кликов мыши, 5 минут — и результирующий текст на русском языке с иллюстрациями готов стать частью статьи или отчета.
Анализ данных регистра без опасения получить откровенно некорректный результат позволяет оценить эффективность и безопасность лекарственных препаратов, расширить спектр показаний к их назначению, определить потребность в государственных закупках определенных видов лекарств.
С.З.: — Что касается научной сферы, Statzilla помогает повысить достоверность выводов исследования. И для России это весьма актуально.
По данным последних научных обзоров, в 85% российских биомедицинских исследований статистические расчеты под сомнением — речь идет как о некорректном преподнесении анализа, так и о грубых ошибках обработки данных. Эту удручающую картину усугубляет то, что мировые стандарты, предъявляемые к статанализу, постоянно расширяются и ужесточаются.
«Статзилла» помогает нагнать мировой уровень, снимая необходимость для исследователей проходить многолетние курсы обучения по статистике, при этом гарантируя адекватный выбор метода и интерпретацию результата его применения. Это позволяет ученому сконцентрироваться на задаче и результатах исследования, не отвлекаясь на рутину статистики. При участии «Статзиллы» уже получено 10 патентов на прогнозные модели предрасположенности и развития заболеваний, были успешно защищены 50 кандидатских и 3 докторских диссертации в различных сферах науки (медицина, биология, психология, социология, экономика и т. д.).
N: — На каких условиях будет реализовано ваше партнерство с «Росмединфо»? Е.В.: — На условиях White label: «Росмединфо» не будет продвигать наш бренд на своей площадке. Но при этом и мы не предоставляем федеральной компании никаких исключительных прав и остаемся открытыми для любого сотрудничества как в сфере научных исследований, так и в сфере бизнес-проектов.
N: — Насколько высок спрос на услуги «Статзиллы» среди региональных компаний? Е.В.: — Мы бы назвали его сдержанным. Но этот спрос пока еще только формируется. Видите ли, термины «биг дата», «машинное обучение» успели войти в модный лексикон владельцев и менеджеров компаний. Но в действительности далеко не все наладили хотя бы сбор данных, не говоря уже об анализе и прогнозировании. Поэтому наши услуги больше востребованы зрелыми международными компаниями, которых догоняют московские. Это компании, имеющие дело с обширными базами данных, руководство которых понимает, что грамотный анализ собранной информации может обеспечить рост продаж, оптимизировать бизнес, выработать эффективную рыночную стратегию — одним словом, произвести тюнинг бизнеса с помощью математики.
К примеру, для бизнес-структур, функционирующих по принципу market place — Avito, Uber, — статистический анализ — дело обыденное и необходимое. Для региональных компаний прийти к пониманию необходимости такого анализа — уже большой прогресс. Тем не менее мы выполняли заказы ростовских предприятий. Некоторые кейсы мы не вправе разглашать. Из того, о чем говорить можно, — выполнили прогнозное исследование для транспортной компании «Везет всем», для производителя хлебцев марки «Хлебцы-молодцы». В последнем случае заказчик готовился предложить рынку непривычный для себя продукт, выйти в премиум-сегмент. Мы помогли уточнить справедливую цену — ту, которую примет покупатель, — и спрогнозировать долю на рынке.
N: — Угадали с долей? Е.В.: — Пока рано об этом судить. Прогноз был на год, а продукт запущен совсем недавно.
С.З.: — Бизнес-структуры пользуются услугами «Статзиллы» главным образом в сфере прогнозной аналитики, в том числе связанной с прогнозом поведения посетителя интернет-магазина, с детальной стратификацией целевой аудитории, с определением торговой стратегии в отношении потенциальных покупателей, машинным обучением — отладкой алгоритма работы сайта, интернет-магазина или отдела продаж с целью повышения его эффективности.
Мы помогаем выстроить работу онлайн-площадок наших клиентов таким образом, чтобы сделать их поведение максимально гибким, что ведет к увеличению продаж и повышению лояльности покупателей. Образно говоря, интернет-витрина подстраивается под каждого посетителя, продавец знает, как лучше вести себя с тем или иным потенциальным покупателем, что и как ему предлагать, а те, в свою очередь, остаются довольны контентом и тем, что не пришлось тратить лишнего времени на просмотр не интересующих их товаров и предложений. Кроме того, если у продавца уже собрана статистика о покупателях, мы помогаем определить таргет-группы по большому количеству параметров, что бывает незаменимо при выработке торговой концепции, рекламной кампании, брендировании и выполнении многих других бизнес-задач. Если говорить о работе в «ручном режиме», когда заказчик не самостоятельно пользуется нашим онлайн-сервисом, а обращается непосредственно в компанию, то наиболее интересные, содержательные исследования можно провести, когда сотрудничество начинается на самом начальном этапе и мы участвуем в разработке так называемого дизайна исследования: исходя из стоящей задачи определяем, как и в каком объеме нужно собрать данные с прицелом на наиболее подходящий метод их обработки. Определение критериев включения в выборку, работа с выбросами (аномальными значениями) — все это влияет на информативность конечного результата. К тому же разработка грамотного дизайна исследования позволяет минимизировать трудозатраты на его проведение.
N: — Как давно существует Statzilla? С.З.: — Мы образовались два года назад, одновременно с открытием ЦРП «Новый Ростов», в коворкинге которого и размещаемся. Это совпало с получением нами гранта «УМНИК» от Фонда содействия инновациям.
N: — У вас большой штат сотрудников? Планируете расширяться? С.З.: — Сейчас в нашей команде 6 человек, и мы как учредители довольно плотно заняты в самом процессе анализа данных для крупных клиентов, так как специалистов с такими компетенциями найти в регионе сложно. Но мы обучаем наших сотрудников и, как только сможем чуть больше отстраниться от операционной деятельности, конечно, хотим расширяться и предлагать более широкий спектр услуг. Также в наших планах — создание продуктов по анализу данных, «заточенных» именно под бизнес, предназначенных помочь или даже заменить аналитика в компании.