Онлайн-митап по дата-инжинирингу. На мероприятии разработчики компании IT_One на примере финансовых данных расскажут о способах и проблемах дедупликации большого объема данных невысокого уровня качества, а также о методах решения проблем с помощью Apache Hive и других инструментов (презентация с мероприятия).
Еще одной темой доклада станет вопрос о том, как использование готовых данных в виде JSON позволяет уменьшить количество промежуточных операций (презентация с мероприятия).
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.