Новости и объявления

27  августа 2015, 12:00

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

1. Towards self-management in a distributed column-store system
Г. Чернышев

Abstract: In this paper, we discuss a self-managed distributed column-store system which would adapt its physical design to changing workloads. Architectural novelties of column-stores hold a great promise for construction of an efficient self-managed database. At first, we present a short survey of an existing self-managed systems. Then, we provide some views on the organization of a self-managed distributed column-store system. We discuss its three core components: alerter, reorganization controller and the set of physical design options (actions) available to such a system. We present possible approaches to each of these components and evaluate them. This study is the first step towards a creation of an adaptive distributed column-store system.

2. Query Skylines for Optimization and Approximate Evaluation
А. Ярыгина и Б. Новиков

A problem of effective and efficient approximate query evaluation is addressed. We consider this problem as a special case of multi-objective optimization with 2 criteria: the computational resources spent for query evaluation and the quality of its result.

We introduce a compact approximate representation of a Pareto set (called skyline), adapt different optimization techniques to solve our problem over extended algebra, and experimentally evaluate them.

The proposed optimization and execution model provides for interactive trade of quality for speed and is also suitable for systems with firm real-time constraints.

3. Сложность распознавания принадлежности слова регулярному языку в системах обнаружения вторжений.
Дмитрий Александров

Доклад посвящен методу решения проблемы ``экспоненциального взрыва'' числа состояний конечного автомата, распознающего множество регулярных языков, задаваемых объединением регулярных выражений вида .*R_1.*R_2.*, где R_1 и R_2 --- произвольные регулярные выражения. Приведены оценки на число состояний автомата при предложенном методе изменения выражений. Представлен способ оценки относительного роста числа слов регулярного языка, задаваемого парой регулярных выражений, при модификации данных выражений. Продемонстрирована практическая эффективность данного метода модификации выражений и предложенного способа оценки применительно к регулярным выражениям системы Snort.

30 мая 2015, 10:00

Петергоф, МАТ-МЕХ, ауд. 2414.

Защиты выпускных квалификационных работ бакалавров

21 мая 2015, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Выборы на должность ст. преподавателя (А.С. Ярыгина)
Промежуточный отчет о ходе исследовательской работы
Кирилл Чередник

Вопрос построения системы обработки нечетких запросов является актуальной проблемой на сегодняшний день. В данном докладе рассматривается вопрос оптимизации запросов к подобной системе, ввиду того, что общепринятые подходы не заточены на условие нечеткости, а также влияние специфики задачи на возможные подходы к её решению.

07 мая 2015, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Кодовые криптосистемы с открытым ключом
Елизавета Востокова

Актуальность представленной работы определяется потребностью в исследовании альтернативных классическим криптосистем с открытым ключом.

Активное развитие теории чисел в последние несколько лет, а так же постоянно растущая мощность вычислительных машин значительно снизило стойкость мирового стандарта - систему RSA. Этот факт делает необходимым исследование и поиск других криптосистем с открытым ключом для замены RSA. Одной из таких альтернатив являются кодовые

криптосистемы, то есть криптосистемы, основанные на задачах из теории кодов, исправляющих ошибки. В основе кодовых криптосистем лежит идея использования быстро декодируемых кодов, исправляющих ошибки, в качестве основного элемента шифрующего преобразования. В настоящее время широкую известность получили две кодовые криптосистемы — криптосистема Мак–Элиса и криптосистема Нидеррайтера, оригинальные версии которых используют коды Гоппы и расширенные коды Рида–Соломона, соответственно. В.М. Сидельников и С.О. Шестаков показали, что при использовании расширенных кодов Рида-Соломона системы не будут стойкими. В докладе будут рассмотрены обе системы и представлены способы атак, хоть и не вскрывающие данные системы, но все же компрометирующие их. Будет описана модификация криптосистемы Мак-Элиса, стойкая к этим атакам.

Промежуточный отчет о научно-исследовательской работе
Дарья Дзендзик

23 декабря 2014, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Linked Data Benchmark Council: Benchmarking for RDF and Graph Databases
Andrey Gubichev, TU Munich, http://www3.in.tum.de/~gubichev/

Graph-like and schema-last data models are receiving increased attention in database research and practice. Benchmarking has a stellar record of leading to rapid performance improvement and maturation, as exemplified by the dramatic success of the TPC benchmarks in the relational domain. LDBC is a European FP7 research project and subsequent industry association with the intent of replicating TPC’s success in the domain of the emerging graph and RDF data models. LDBC is now two years underway and has gathered strong industrial participation for its mission. In this talk I will describe the LDBC Social Network Benchmark (SNB) and present database benchmarking innovation in terms of methodology (choke-point driven design), correlated graph data generation, scalable benchmark driver on a workload with complex dependencies, and parameter selection for benchmark queries.

SNB has three query workloads under development: Interactive, Business Intelligence, and Graph Algorithms. In the talk I will describe the SNB Interactive Workload in detail and illustrate the workload with some early results, as well as the goals for the two other workloads.

06 ноября 2014, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Методы и средства эффективного выполнения декларативных сценариев аналитической обработки данных на основе оптимизации и приближенных вычислений
А. Ярыгина, Б. Новиков

Представляемая работа посвящена разработке методов и средств эффективного выполнения сценариев нечеткой аналитической обработки данных на основе оптимизации запросов и приближенных вычислений при ограничениях на доступные ресурсы.

В рамках доклада представлена теоретическая модель оптимизации и контролируемого приближенного выполнения нечетких запросов, включающая расширяемую алгебру, понятия качества и аддитивного ресурса, абстрактную модель стоимости и качества операций и понятие оптимальной стратегии приближенного выполнения при различных ограничениях на время вычислений и качество ответа.

Существенная часть доклада посвящена решению задачи распределения фиксированных ресурсов среди операций в плане приближенного выполнения запроса на основе моделей качества, что обеспечивает возможность выполнения декларативных сценариев в реальном времени.

Рассматриваются также методы решения задачи многокритериальной оптимизации запросов, ориентированные на специфические ограничения на время вычислений и качество результата.

Предложенные в работе подходы, модели и методы позволяют сочетать хорошо известные преимущества декларативных языков с гибкостью современных распределенных систем аналитической обработки.

16 октября 2014, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Оценка качества кластеризации
Елена Сивоголовко
Configuring semi-supervised methods considering uncertainties
German Sapoghnikov

In the world there is a huge amount of unlabeled data in various fields, and the relatively small number of labeled. Marking up the data requires a lot of effort. Required to minimize the work of the man on the marking up data. To achieve this, we try to combine the ideas of domain adaptation methods, active and semi-supervised learning, and to help the man to make a quick adaptation of the classifier to a new data.

This presentation is dedicated to changing the structure of the classifier, the aspect extraction in different languages ​​and interactive classification. Then I will present a plan for further work related to the association of the different parts to a single thesis.

Руководители и темы аспирантов первого года
Елизавета Востокова, Георгий Ерохин, Павел Федотовский, Кирилл Чередник

18 сентября 2014, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Оценка качества кластеризации
Елена Сивоголовко

Кластеризация является одной из ключевых областей интеллектуального анализа данных. Кажущаяся простота постановки задачи, возможность выявления скрытых взаимоотношений между данными как на множестве в целом, так и внутри каждого кластера по отдельности, а так же несомненное улучшение восприятия аналитиками данных, разбитых на кластерную структуру, — всё это делает методы кластерного анализа широко используемыми в самых различных областях. Оценка качества очень важна для всего процесса кластеризации, потому что без неё полученная структура кластеров не может быть сочтена достаточно достоверной для того, чтобы делать из него какие-то выводы или проводить дальнейший анализ на её основе. Автоматические методы оценки качества кластеризации могут быть рассмотрены как функции от полученной кластерной структуры и исходного множества, в литературе они носят названия индексов или метрики. Их использование может упростить оценку качества кластеризации, в случаях приведённых выше, а так же повысить её эффективность. В рамках доклада будет рассмотрен основной спектр индексов оценки качества кластеризации, разработанный и используемый на текущий момент. Рассмотрен вопрос применимости различных индексов оценки качества к разным классам алгоритмов кластеризации. Представлено исследование о влиянии ошибок данных на качество кластеризации. Поднята проблема о семантической стороне оценки качества кластеризации. Предложен способ ее решения с помощью RDF модели.

27 мая 2014, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Adaptively Approximate Techniques in Distributed Architectures
Barbara Catania, University of Genova, Italy

The wealth of information generated by users interacting with the network and its applications is often under-utilized due to complications in accessing heterogeneous and dynamic data and in retrieving relevant information from sources having possibly unknown formats and structures. Processing complex requests on such information sources is, thus, costly, though not guaranteeing user satisfaction.

In such environments, requests are often relaxed and query processing is forced to be adaptive and approximate, either to cope with limited processing resources (QoS-oriented techniques), possibly at the price of sacrificing result quality, or to cope with limited data knowledge and data heterogeneity (QoD-oriented techniques), with the aim of improving the quality of results. While both kinds of approximation techniques have been proposed, most adaptive solutions are QoS-oriented. Additionally, techniques which apply a QoD-oriented approximation in a QoD-oriented adaptive way (called adaptively approximate techniques), though demonstrated potentially useful in getting the right compromise between precise and approximate computations, have been largely neglected.

In this talk, after presenting and classifying several approximate and/or adaptive query processing approaches, proposed for different distributed architectures, we show, with some concrete examples, the benefits of using adaptively approximate techniques. We then present the result of our ongoing research in the context of data stream and geo-social data management.

26 февраля 2014, 17:20

Петергоф, Университетский пр. 28, МАТ-МЕХ, ауд. 2414.

Talking to the Database in a Semantically Rich Way: A New Approach to Resolve Object-Relational Impedance Mismatch
Henrietta Dombrovskaya, Senior Database Architect, Enova, Chicago, USA

Conventional recommendations for Object Oriented application design include the concept of Object-Relational Mapping and suggest clear separation of business logic from interaction with the database. While these requirements seem natural to application developers, it prevents them from using the full power of the database engine, and thereby become the most essential source of application performance degradation. Acknowledging the widespread usage of the above concepts, new approach developed at Enova provides an algorithm for “splitting” logic between different layers of classes.

We identify the parts of logic that are essential for data retrieval and thereby belong to the database, and the parts of logic that drive the computation or other data transformation and can reside in the application model. Although the splitting logic algorithm, as yet, is not implemented in any tool, we consider it an important part of the application design process. This presentation provides examples of redesigned methods as well as before-and-after performance data from the production system.

03 октября 2013, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Алгоритмы приближенного выполнения алгебраических операций и моделей стоимости для распределенной масштабируемой среды.
Алиса Пигуль

24 сентября 2013, 12:50

Университетский пр. 28, МАТ-МЕХ, ауд. 405.

12 сентября 2013, 15:30

14 линия В.О., д. 29, МАТ-МЕХ, ауд. 11.

Отчеты и аттестация аспирантов кафедры.

04 апреля 2013, 11:30

МАТ-МЕХ, к. 4388.

выборы заведующего кафедрой.
Г.А. Леонов

24 января 2013

 

Издан приказ ректора о создании кафедры информационно-аналитических систем.

 .

Courses

Другие ресурсы

Санкт-Петербургскй государственный университет
Математико-механический факультет
Публикации исследовательской группы
 Конференция
ISMW-FRUCT
Коллоквиум молодых исследователей - апрель 2015