Организация информации

Вопросы по курсу "Методы организации информации" 2013 года

Внимание! в 2010 - 2013 годах вопросы были, а в 2015 году могут быть несколько другими.

  1. Sequence класиификаторы. Дискриминативные и Генеративные модели. Отличия, преимущества.
  2. Multiclass и Multilabel. Как решить эти задачи, используя SVM классификатор?!
  3. Линейные и нелинейные классификаторы. Влияние выбора метрики и параметров на результаты. kNN с параметром k = 1.
  4. Underfitting, Overfitting. Как бороться? Что делать, если очень много данных?
  5. Классификация для задач анализа текстов на естественном языке. Анализ мнений.
  6. Паттерны. Их использование для классификации. Выбор между точностью и полнотой.
  7. Классивикация и обучение без учителя, с частичным привлечением учителя.
  8. Варианты алгоритма кластеризации k средних.
  9. Методы оценки качества кластеризации
  10. Плостностные алгоритмы кластеризации
  11. Иерархические флгоритмы кластеризации
  12. Основные понятия, связанные с нечеткой кластеризацией
  13. Кластеризация в пространствах очень высокой размерности
  14. Методы интеграции схем
  15. Разрешение семантических неоднородностей с помощью онтологий
  16. Оценка качества информации
  17. Методы очистки данных
  18. Сравнение строк в операции соединения по подобию
  19. Выполнение соединения по подобию с использованием MapReduce
  20. Соединение по подобию в реляционных БД
  21. Методы обнаружения "почти дубликатов"
  22. выполнение аналитических запросов над зашифрованными данными
  23. Расширения MapReduce для аналитической обработки
  24. Исползование общих подаросов при аналитической обработке
  25. Пошаговое обновление материализованых представлений
  26. Динамическое распределение данных при аналитических вычислениях
  27. Раскрутка для оценки результата при приближенном выполнении запросов
  28. Метод хеширования с учетом пространственного расположения объектов
  29. Методы выполнения запросов на поиск ближайших соседей
  30. Сопоставление методов хранения данных по строкам и колонкам
  31. Использование сжатия данных в системах с хранением по колонкам
  32. Материализация в системах с хранением по колонкам
  33. Реализация проекций в БД с хранением по колонкам
  34. Методы оценки производительности для БД с хранением колонок
  35. Повторное использование промежуточных результатов в Monet DB
  36. Методы индексирования для систем с хранением по колонкам
  37. Управление размещением данных в распределенных системах с хранением по колонкам
  38. Алгоримы фрагментации для систем с хранением по колонкам

Дополнительные замечания

Для успешной сдачи зачета (или экзамена) необходимо знать свое имя, отчество и фамилию, название курса, имя, отчество и фамилию преподавателя практических занятий (если практические занятия предусмотрены учебным планом) и лектора, номер своей группы, специализацию и желаемый вид отчетности (зачет или экзамен).

При подготовке допускается использование любых материалов (конспектов, слайдов, учебников, шпаргалок и т.п.), но во время ответа требуется понимание записанного при подготовке. В частности, основные утверждения (определения и др.) должны быть известны без подготовки.

Не допускается коллективная подготовка ответов, обсуждения и взаимные консультации во время подготовки ответов.

В начале ответа предполагается, что отвечающий знает весь материал. Как правило, дополнительные вопросы задаются для того, чтобы получить опровержение этого предположения (то есть убедиться в отсутствии знаний). Из этого следует, что ответы на дополнительные вопросы не могут улучшить оценку.

Отсутствие информации в конспекте не принимается во внимание при оценке ответов.

Слайды, использованные во время лекций, НЕ являются полным изложением материала, необходимого для успешного получения отчетности (то есть зачета или экзаменационной оценки) по курсу. Неспособность предствить материал в альтернативных вариантах рассматривается как минус и может приводить к снижению оценки.

При ответе на любой вопрос допускается изложение точек зрения, не совпадающих с точкой зрения лектора или авторов любой из рекомендованных публикаций, но в любом случае (то есть независимо от совпадения с каким-либо источнником) отвечающий должен быть в состоянии мотивированно обосновать то, что он/она рассказывает. Наличие обоснованной точки зрения, отличающейся от точки зрения лектора, и аргументированное несогласие с лектором рассматриваются как плюс.

Курящим следует воздерживаться от курения в течение не менее чем поулчаса до начала подготовки до окончания зачета или экзамена.