Конференция СПИСОК

Программа секция "Методы хранения, поиска и анализа информации"

25 апреля 2014, 09:45, ауд. 2414

09:45

Открытие секции

10:00-11:30

Заседание 1. Председатель: Н.Г. Графеева

10:00

Supporting additional tree data structures in GiST

Pavel Fedotovsky, Kirill Cherednik and Chernishev George.

In this paper we deal with the Generalized Search Tree (GiST), an index data structure supporting an extensible set of queries and data types. We show how the rigor of its contract creates formidable obstacles for its usage with some of the recently developed tree structures. We also introduce a modification to GiST that solves aforementioned problem for some of these structures without interfering with GiST’s concurrency control mechanism. Next, some guidelines for adjusting existing GiST-based trees are presented. Finally we illustrate our technique via a Revised R*-tree (RR*-Tree) implementation

10:30

Text detection in natural scenes with multilingual text

Mikhail Zarechenky

: Detecting text in natural scenes is an important prerequisite for further text recognition and other image analysis tasks. Most of text detection methods for scene images usually use a priori knowledge of language to detect text. As a rule such algorithms are evaluated on datasets which contain scenes only with text in English. This paper discusses known text detection algorithms and investigates them for invariance to the language.

10:50

ВЫЯВЛЕНИЕ ТОЧЕК СМЕНЫ РЕЖИМА В СИГНАЛАХ В РЕАЛЬНОМ ВРЕМЕНИ

Анастасия Никитина

В работе рассматривается задача обнаружения точек смены режима в одномерных дискретных сигналах, поступающих в реальном времени. В качестве метода решения предлагается алгоритм, основанный на идее, заимствованной из области анализа изображений, а именно – построении и последующем анализе дескрипторов, характеризующих участки сигнала.

11:10

Creating sentiment dictionaries and analysis of goods reviews in Russian

Alina Dubatovka.

Nowadays a lot of people use different online services and online shops for choosing and buying products. And often these services and shops can not only provide data for opinion extraction but also some structure and rating to simplify this analysis. In this paper the method for creating sentiment dictionaries and analysis of goods reviews using information and structure of reviews from online shops such as Yandex.Market is described.

11:30

Перерыв

11:50 - 12:50

Заседание 2. Председатель: Е.Г. Михайлова

11:50

Управление данными об отходах потребления на примере города Петрозаводска

Olga Ianiuk

Проблема реорганизации системы управления отходами потребления(ОП) актуальна для многих городов России, в том числе для столицы Республики Карелия – города Петрозаводска. Однако, в отличие от многих других городов Северо-Западного федерального округа, в Петрозаводске существует ряд благоприятных условий для внедрения одного из самых эффективных, с точки зрения экономики и экологии, подходов к модернизации отрасли – внедрению раздельного сбора твёрдых бытовых отходов (ТБО) с последующей их переработкой для получения востребованного вторсырья.

На пути решения данной проблемы городу необходимо изучать и использовать не только опыт и лучшие практики развитых стран, но и учитывать всё большее проникновение информационно-коммуникационных технологий в повседневную жизнь. Например, потоки данных с сенсоров, встроенных в городское пространство, могут помочь операционной деятельности городских служб в настоящем и принятию эффективных решений по городскому развитию в будущем.

В докладе будет представлено описание существующих источников информации, получение данных из которых может иметь значение для исследования системы управления ОП в Петрозаводске, а также подходящих программных инструментов управления ими. Подходящих, в частности, означает, что инструменты должны учитывать ряд особенностей данных, связанных с предметной областью: доступность, разнородность, в терминах моделей данных, привязка к пространству и времени, потенциально значительные объёмы; требования конфиденциальности и прочее.

Для исследования городского пространства с точки зрения системы управления ТБО, частичные результаты которого и представляются в докладе, строится аналитическая система на основе декларативных средств извлечения, обработки, интеграции и логического управления данными.

12:10

КЛАСТЕРНЫЙ АНАЛИЗ КЛИНИКО-МОРФОЛОГИЧЕСКИХ ПОКАЗАТЕЛЕЙ У БОЛЬНЫХ СО СМЕШАННОЙ ИНФЕКЦИЕЙ(ТУБЕРКУЛЕЗ, ХРОНИЧЕСКИЙ ВИРУСНЫЙ ГЕПАТИТ, ВИЧ)

Evgeniia Pigul.

В данной статье рассмотрена проблема выявления значимых признаков и взаимосвязей между данными признаками у больных со смешанной инфекцией. Ее решение достигается с помощью кластерного анализа. Были проведены эксперименты по следующим признакам: показатели анализа крови, биохимии крови, белковых фракций, качественные и количественные признаки из морфологических описаний биопсий. На основе кластерного анализа из них были выделены наиболее значимые группы признаков и влияние разных признаков друг на друга.

12:30

РЕАЛИЗАЦИЯ ОБОБЩЕННЫХ ОПЕРАТОРОВ РЕЛЯЦИОННОЙ АЛГЕБРЫ В СИСТЕМЕ ASTERIXDB

Nickolay Saveliev.

Объем данных, отличающихся различной структурой, растет с каждым годом. Обработка таких данных требует специальных подходов, методологий и инструментов. Именно поэтому, требуются системы, способные эффективно работать с различными форматами данных и информационными ресурсами. Такие системы должны обладать мощным языком запросов, оптимизатором на основе обобщенной реляционной алгебры и модели стоимостей и обработчиками данных, способными работать с различными информационными форматами.

Одним из способов создания такой системы является представление отдельных систем управления базами данных как информационных источников, что избавляет разработчиков от реализации обработки информации. В таком случае для поддержки информационного ресурса требуется реализовать трансляцию операторов расширенной реляционной алгебры в язык целевой платформы исполнения запросов, а также модель стоимостей, позволяющей оптимизатору выбирать не только оптимальный план, но и платформу, на которой запрос будет исполняться максимально эффективно. Основная цель этой работы заключается в реализации таких частей для системы AsterixDB BDMS которая используется в качестве платформы исполнения

12:50

Закрытие секции