Анна Зверькова из компании IT_One выступила с презентацией на митапе «IT_One Data Meetup: обработка и хранение данных» 29 июня.
В презентации на примере финансовых данных рассказывается о существующих способах и проблемах дедупликации большого объема данных невысокого уровня качества, а также о методах решения проблем с помощью Apache Hive и других инструментов.
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.