+7 499 135-41-63 (ВЦ РАН)
   info@forecsys.ru
      или посмотреть карту сайта
01 февраля 2018
«Форексис» на конференции OpenTalks.AI

 

27 декабря 2017
Компания «Форексис» поздравляет вас с наступающим Новым годом и Рождеством!

 

22 декабря 2017
Завершен совместный проект компаний «Форексис» и IBS по созданию системы полнотекстового поиска по документам ГАС «Управление»

 

21 декабря 2017
Лицензионное соглашение между компаниями «Форексис» и «АТОН»

 

12 декабря 2017
Check4Trick в Едином реестре российских программ для электронных вычислительных машин и баз данных

 

29 ноября 2017
«Форексис» на форуме «Борьба с мошенничеством в сфере высоких технологий. Antifraud Russia – 2017»

 

28 ноября 2017
Начат проект по разработке нового АРМ аналитика системы САФРАН

 

13 ноября 2017
Завершен проект разработки подсистемы управления данными в оперативной памяти (InMemory) для системы «САФРАН»

 

02 ноября 2017
МФТИ в сотрудничестве с компанией «Форексис» провел исследование текущих процессов в области управления заказами клиентов «ТехноНИКОЛЬ» и управления привлекаемым транспортом

 

23 октября 2017
В НСФР состоялось заседание Подгруппы по тестированию критериев противодействия неправомерному использованию инсайдерской информации и манипулирования рынком (ПНИИИиМР)

 

Новости

Специалисты компании «Форексис» завершили исследовательский проект по прогнозированию влияния новостного потока на изменение цен инструментов

Для анализа текстовых данных были выбраны экономические новости за период 01.04.2016-30.06.2016. По каждой новости анализировались следующие показатели: уникальный идентификатор, рубрика, теги, дата публикации, заголовок, подзаголовок и текст новости. Исследование включало в себя этапы предобработки текстовых данных, построения и тестирования модели прогнозирования.

На этапе предобработки тексты были переведены в нижний регистр, были удалены неинформативные знаки и символы (числа, запятые, стоп-слова и др.) Для коллекции текстов был построен словарь, для слов в словаре подсчитаны значения важности (TF-IDF). Для каждого текста был построен набор признаков по принципу «мешка слов» с использованием наиболее важных слов.

В качестве данных с финансового рынка были взяты временные ряды цен акций «Газпром» за аналогичный временной период. Для каждой новости, опубликованной в рабочее время, была вычислена вещественная оценка влияния новости на цену акции, превышение среднего значения цены после выхода новости. Признаковое описание текстов и оценки влияния новостей составили выборку для модели прогнозирования.

В качестве моделей прогнозирования использовались наивный байесовский классификатор, случайный лес на бинарных признаках, а также случайный лес на признаках TF-IDF. Модели сравнивались по критерию площади под кривой (ROC-AUC), усредненной по тестовым выборкам кросс-валидации. Наилучший результат показала модель байесовского классификатора с отбором признаков.

Исследование проводилось в рамках работ по модернизации системы Check4Trick для мониторинга и анализа результатов торгов.

Ознакомиться с результатами исследования вы можете, прислав заявку в аналитический отдел компании «Форексис» на адрес info@forecsys.ru.

Дата публикации: 18.07.2017

вернуться к другим новостям