Выпуск 15 (113), с 25 по 30 апреля
Эффективность систем искусственного интеллекта во многом достигается за счет достаточного количества данных. Существуют две связанные с этим проблемы: общая нехватка данных и их недостаточно высокое качество. Если крупные корпорации могут себе позволить инвестировать большие средства в сбор и агрегацию данных, то более мелкие компании зачастую вынуждены использовать данные, которые находятся в открытом доступе.
При этом в высококонкурентных областях, например для беспилотных автомобилей, общедоступные датасеты подходят только для решения любительских и экспериментальных задач, рассказал ICT.Moscow Владимир Новоселов из Mail. ru Group. С ним соглашаются и другие участники рынка, отмечая, что наличие общедоступных датасетов помогает только на начальном этапе проверки гипотез и они не подходят для финальных разработок.
Александр Крайнов из Яндекса считает, что нужно говорить не о качестве данных, а об их репрезентативности:
Александр Крайнов
руководитель лаборатории машинного интеллекта, Яндекс
Когда говорят о некачественных данных, как правило имеют в виду их недостаточную «чистоту». При этом, по словам Дениса Власова из «Учи.ру», абсолютно чистых данных не бывает, а избегать следует системных искажений в выборке. Если входные данные включают в себя ошибки, то будут получены искаженные выводы, даже если сам по себе алгоритм правильный, соглашается с ним и Адель Валиуллин из «Газпромбанка». Таким образом эксперты сходятся во мнении, что для решения прикладной задачи помимо публичных данных потребуется и дообучение модели на собственных данных.
Не решат всех проблем и синтетические данные, то есть сгенерированные другими нейросетями. Как правило они могут эффективно помочь только на стартовом этапе подготовки нейронных сетей. По словам Дмитрия Акимова из VisionLabs, синтетические данные позволяют обеспечить базовое обучение, но на следующих этапах все равно потребуются реальные данные, поскольку «синтетика» не всегда дает прирост точности.
Мнения 12 экспертов о том, на каких данных обучают нейросети российские компании и нужно ли дополнительное регулирование рынка, собраны в этой статье на ICT.Moscow.
На этой неделе в Москве начала работать система ИИ-диагностирования COVID-19. Ее запустили на базе единого рентгенологического информационного центра, где ранее уже приступили к изучению применения искусственного интеллекта для своевременного выявления онкологических заболеваний. Сейчас ИИ-система на основе рентгеновских снимков будет выявлять COVID-19. Ранее закон о проведении эксперимента в Москве в области искусственного интеллекта подписал глава государства.
Свои разработки для выявления вирусных заболеваний тестируют и распространяют и компании из Москвы. Сбербанк предоставил регионам бесплатный доступ к своей экспериментальной модели искусственного интеллекта для помощи врачам в диагностике и лечении COVID-19. В банке уточняют, что модель по компьютерной томограмме (КТ) классифицирует пациентов на инфицированных и неинфицированных, а в первом случае определяет по КТ изменения, вызванные коронавирусом, и позволяет оценить объем этих изменений.
Еще на прошлой неделе в одной из больниц в Отрадном сеть клиник «Медси» вместе с платформой «Третье мнение» запустили технологию наблюдения за пациентами на основе искусственного интеллекта. Botkin.AI, представивший ИИ-решение по выявлению пневмонии и коронавируса, планирует вместе с Mail.ru Cloud Solutions интегрировать разработку в медицинские учреждения.
Специальный фильтр для ИИ-кейсов, относящихся к сфере COVID-Tech, добавлен в базе знаний искусственного интеллекта на ICT.Moscow. Сейчас их уже более 10, подборка регулярно пополняется.
Также на нашем сайте собирается и регулярно пополняется таймлайн новостей о московских разработках для борьбы с COVID-19. Он доступен по этой ссылке.
Прототип робота для дезинфекции продуктовых тележек в магазинах и торговых центрах для борьбы с COVID-19 представила на этой неделе компания «BID Technologies» (резидент «Сколково»). Роботизированная ячейка обрабатывает тележки с помощью дезинфицирующего средства, которое распыляется по заданному алгоритму. В будущем компания планирует представить робота для дезинфекции продуктовых корзин.
Тем временем робот-дезинфектор помещений из лаборатории робототехники Сбербанка уже проходит тестирование в медицинском учреждении. Разработчики намерены отработать сценарии применения роботизированной дезинфекции и провести донастройку прототипа при его взаимодействии с врачами. Управлять роботом можно как удаленно, так и через экран-дисплей и голосовые команды.
Другой отечественный робот Яндекс.Ровер начал доставлять документы и посылки на территории Сколково. Робот-курьер умеет передвигаться по тротуарам, самостоятельно планировать движение, следить за окружающей обстановкой и объезжать препятствия. В будущем Яндекс планирует подключить к использованию робота стартапы и крупные корпорации.
Как ранее рассказала ICT.Moscow Алиса Конюховская из НАУРР, «у Яндекса — крутой кейс, потому что у них есть те процессы, которые реально в этом нуждаются. У компании есть внутренний спрос и финансовые ресурсы. Ей будет намного легче чем другим стартапам осуществлять разработку и ее внедрять». Подробнее об этом читайте в материале на ICT.Moscow. Также в ассоциации можно получить профильную (и пока бесплатную до 30 мая) консультацию о специфике рынка робототехники и отдельных его сегментов, поиске зарубежных партнеров.
ICT.Moscow вошел в топ-20 цитируемых отраслевых СМИ. Впервые мы стали участниками списка «Медиалогии» по итогам II квартала 2019 года.
Подпишитесь на еженедельную рассылку I CAN TELL, чтобы быть в курсе основных событий ИТ-рынка Москвы
ICT.Moscow
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.