г. Екатеринбург

дистанционно с 15 по 30 апреля 2019 года

 

Участие

  • пленарные заседания
  • участие в секции
  • мастер-классы
  • видеовыступление

Вход на сайт

Поиск




Климовских И.А. БОЛЬШИЕ ДАННЫЕ. В ШКОЛЕ?

Оцените материал
(1 Голосовать)

Стоит ли говорить о том, что ребенок, родившийся в 2016 году, раньше научится нажимать на кнопки, чем говорить? Ребенок, родившийся в 2016 году, научится управлять виртуальным самолетом или танком раньше, чем научится писáть. Ребенок, родившийся в 2016 году, самые передовые виртуальные бизнес–концепции научится использовать раньше, чем считать.

Остановить эти процессы невозможно. Таковы законы информационного общества. Естественно, что объемы информации стремительно растут. По оценке эксперта компании Google Эрика Шмидта, каждые два дня человечество поставляет столько же информации, сколько было произведено со времени возникновения цивилизации до 2003 года. И это только начало. Поэтому не случайно в 2008 году появился термин Big Data. Введение термина «большие данные» относят к Клиффорду Линчу, редактору журнала Nature, подготовившему к 3 сентября 2008 года специальный номер журнала с темой «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объёмами данных?», в котором были собраны материалы о феномене взрывного роста объёмов и многообразия обрабатываемых данных и технологических перспективах в парадигме вероятного скачка «от количества к качеству». Термин был введен в отношении научных данных. Тем не менее, уже в 2011 году компания Gartner отмечает большие данные как тренд номер два в информационно-технологической инфраструктуре (после виртуализации и как более существенный, чем энергосбережение и мониторинг).

Прогнозируется, что внедрение технологий больших данных наибольшее влияние окажет на информационные технологии в производстве, здравоохранении, торговле, государственном управлении, а также в сферах и отраслях, где регистрируются индивидуальные перемещения ресурсов.

А что же школа? Образование. Останутся в стороне? Возможно ли? Что же понимают под большими данными? Большими данными допустимо называть любые потоки информации объемом более 100 Гб в сутки. В качестве определяющих характеристик для больших данных отмечают «три V»:

1. Объём (англ. volume), т.е. физический объём информации. Хранение больших объемов информации требует специальных условий, а это вопрос пространства и возможностей.

2. Скорость (англ. velocity), т.е. скорость прироста новой информации и необходимость высокоскоростной обработки и получения результатов. Скорость связана не только с возможным замедлением из-за устаревших методов обработки. Это еще и вопрос интерактивности: чем быстрее процесс, тем больше отдача, тем продуктивнее результат.

3. Многообразие (англ. variety), т.е. возможность одновременной обработки различных типов структурированности данных. Проблема неоднородности и неструктурированности возникает из-за разрозненности источников, форматов и качества данных. Чтобы объединить данные и эффективно их обрабатывать, требуется работа по приведению их в пригодный для систематизации вид.

По результатам работы всех информационных систем нашей школы объем информации, генерируемой учениками, родителями, учителями, администрацией, техническими работниками составляет чуть менее 300 Гб в сутки. На школьных серверах такой объем информации уже не размещается. Приходится арендовать внешнее серверное пространство. Скорость прироста новой информации растет экспоненциально. Многообразие данных - это следствие работы различных информационных систем школы. Например: система контроля доступа генерирует информацию об отпечатке пальца, или геометрии лица и передает для распознавания. 1000 посетителей ежедневно, в среднем по 4 раза по 3Мб уже 10 Гигабайт. Видеонаблюдение: с 35 камер ежедневно записывается в стек 100 Гб. Системы дистанционного образования фиксируют ежедневный прирост базы на 70 Гб. Во время карантинных мероприятий эта цифра удесятеряется. Электронный журнал, автоматически связанный с системой контроля доступа (пропуски, опоздания) ежедневно «распухает» на 10Гб (вместе с системой тестирования и почтовым сервером). События в столовой, библиотеке (также с распознаванием образов), электронный документооборот, видеоконференции, система энергосбережения, сайт школы еще «добавляют» 50 Гб. Все остальное - цифровые образовательные ресурсы как привычная среда обитания. Интернет-трафик в сутки составляет в среднем 20 Гб. Внутрисетевой трафик (без видео) в среднем 200 Гб.

Утверждаю, что школа уже работает с Big Data. И подходы к анализу этого объема информации должны меняться. Прошлых средств анализа уже не достаточно. Каковы же реалии и перспективы?

Обратимся к анализу компании McKinsey: «Методы и техники анализа, применимые к большим данным:

  • методы класса Data Mining: обучение ассоциативным правилам, классификация, кластерный анализ, регрессионный анализ;
  • краудсорсинг – категоризация и обогащение данных силами широкого, неопределённого круга лиц, привлечённых на основании публичной оферты, без вступления в трудовые отношения;
  • смешение и интеграция данных- набор техник, позволяющих интегрировать разнородные данные из разнообразных источников для возможности глубинного анализа, в качестве примеров таких техник, составляющих этот класс методов, приводятся цифровая обработка сигналов и обработка естественного языка (включая тональный анализ);
  • машинное обучение, включая обучение с учителем и без учителя, искусственные нейронные сети, сетевой анализ, оптимизация, в том числе генетические алгоритмы;
  • распознавание образов;
  • прогнозная аналитика;
  • имитационное моделирование;
  • пространственный анализ-класс методов, использующих топологическую, геометрическую и географическую информацию в данных;
  • статистический анализ,
  • визуализация аналитических данных: представление информации в виде рисунков, диаграмм, с использованием интерактивных возможностей и анимации как для получения результатов, так и для использования в качестве исходных данных для дальнейшего анализа.

Про распознавание образов, пространственный анализ, машинное обучение повторяться не буду. Необходимо отметить, что после интеграции в электронный журнал многоуровневой системы оценки качества образования (МСОКО, прошу не путать с муниципальной системой оценки качества образования!) появилась реальная возможность кластерного анализа, категоризации данных, интеграции разнородных данных, прогнозной аналитики, имитационного моделирования, статистического анализа, визуализации данных по каждому субъекту и в целом по учреждению. После расширения МСОКО на все школы района уровень методов и техник анализа станет на порядок выше.

 

Прочитано 2519 раз


Оставить комментарий

Убедитесь, что вы вводите (*) необходимую информацию, где нужно
HTML-коды запрещены

2 комментарии

  • Комментировать Четверг, 12 Май 2016 07:54 написал Долинер Л.И.

    Игорь Александрович, добрый день. Как всегда, Вам самый трудный вопрос. Простите, но то, о чем Вы написали, понимает и принимает, скажем так, слишком маленькое число руководителей образования. Не важно какого уровня. Но именно от них зависит, будут ли подобные технологии внедряться, и, самое главное, эффективно использоваться. Можно, конечно, сослаться на отсутствие финансов, но финансы были и в каком-то объеме есть, и, к сожалению, использовались они не то чтобы оптимально. Что сделать, чтобы подобные технологии а) были; б) были поняты и приняты как администрацией, так и учителями?

    Пожаловаться
  • Комментировать Суббота, 23 Апрель 2016 02:54 написал Беспалова В.Ю.

    Это все правильно и действительно актуально. Единственно что. На "кнопки" у клавиатуры, а клавиши. Но "с самые передовые виртуальные бизнес–концепции научится использовать раньше, чем считать" Вы явно погорячились.

    Пожаловаться

Последние статьи

Самые читаемые ДиСО

Самые рейтинговые ДиСО

Комментарии ДиСО-2018

top