?

Log in

No account? Create an account

Entries by category: it

Всемирная клоунада
zmeygor
Слайд со свежей конфы EMNLP (Empirical Methods in Natural Language Processing, где Natural Language Processing - подраздел Машинного Обучения, посвящённый работе с естественными языками)



(а дядечка-презентер за столом, - знаменитый Dan Jurafsky, - один из самых передовых учёных в области)

Всё таки не правы те горячие головы, кто говорит, что мы никакого вклада в человечество не делаем! Делаем, оказывается, и ещё какой! Качественные исходные данные предоставить - это вам не в тёпленьком кабинете сидеть и модельки крутить!

Оригинал записи тут: https://arech.dreamwidth.org/93314.html. Коментить лучше там (OpenID работает), но можно пока и тут.

The GDELT Project
zmeygor
If you torture the data long enough, it will tell you everything!


Наткнулся на офигенное: The GDELT Project - глобальная база данных по событиям, контекстам событий, анализу тона, источникам информации, связанным метаданным и т.д. начиная с 1979 года по сегодняшний день. Пополняется ежедневно. Можно скачать себе на комп для домашнего анализа (около 100 гигов), можно смотреть с помощью онлайн инструментов.

Всего записано порядка 250 миллионов событий, а каждая запись набора имеет 58 атрибутов. Сам набор делится на 300 различных категорий.

Для трейдеров - фундаментальщиков, например, это должен быть просто королевский подарок.
А уж какой простор для новых открытий в стиле


Но ведь серьёзно - безумно интересный набор информации.
Спасибо хабраюзеру kuznetsovin