Яндекс проиндексирует курсовые и докторские всех ВУЗов РФ

Развитие событий: 11 способов, с помощью которых вы можете попробовать достать деньги на некоммерческий проект (и у вас ничего не получится) (5 марта 2015)

Министерство образования намеренно раскрыть в онлайне тексты всех зачётных работ и побороться с плагиатом

"Яндекс" станет самой нелюбимой компанией у русских двоечников. Как сообщают "Известия" министерство образования и науки готовит приказ о размещении в открытом онлайн доступе: квалификационных, курсовых, дипломных, докторских, кандидатских и диссертационных работы всех студентов и аспирантов России. Раскрыть документы и отдать их на индексацию обяжут аккредитованные государством ВУЗы.

Авторы идеи, правительственное Агентство стратегических инициатив (АСИ) подключило к проекту специалистов "Яндекса" для поиска совпадений в раскрываемых работах. То есть выявления случаев добродетельного цитирования или наоборот — плагиата. Инициатива призвана повысить качество образования в стране.

По оптимистичным прогнозам уже в 2013 году "Яндекс" будет искать совпадения в работах учащихся 30–40% ВУЗов РФ. А через 3 года все высшие учебные заведения аккредитованные государством. Пессимистические оценки предполагают сложности в развёртывании. Система поиска плагиата очевидно невыгодна ВУЗам "торгующим" дипломами. Эти заведения просто обязаны саботировать программу. Фиктивное образование переодически ставится в вину чиновникам. Подозрения в плагиате падали и на Президента РФ и на депутатов Думы. Высокие научные звания слабоизученной природы сегодня часто вручаются вместе с "корочками" заурядного бюрократа. Вряд ли кто-то мечтает сдать купленное "научное звание" обратно. Вряд ли он будет благодарен "Яндексу" за найденное "всё".

Комментарий "Яндекса" от 15.01.2013 в 19:00:

Яндекс, действительно, сотрудничает с Агентством стратегических инициатив (АСИ)  в рамках их инициативы по обеспечению открытого доступа к  работам студентов и аспирантов. Наш вклад заключается в том, что мы как эксперты помогаем АСИ сформулировать технические требования к выложенным на сайты вузов работам – чтобы их могли легко проиндексировать и сделать доступными поисковые системы (не только сам Яндекс).

Если эти данные будут выложены в соответствии с такими техническими требованиями, то Яндекс проиндексирует их, и мы будем думать о том, как представить эти данные в наиболее удобном для пользователей формате.

Лучшие комментарии

  • Контекст комментария

    Иван Ильин

    Вообще в заметке и её прочтении, а так же в странном поведении «Известий» — «белых пятен» много. Обозначу контур одного из таких пятен. 15-го октября 2012-го года в Минкомсвязи состоялось заседание экспертного совета по информтехнологиям. На закрытом заседании, о котором известно далеко не всё, присутствовали топы IT-бизнесов. Например, нашего голландского Яндекса, Parallels, СКБ Контура и др. http://roem.ru/2012/10/15/govdata55544/ Если верить «Ведомостям»: гендиректор «Яндекса» Аркадий Волож предложил создать специальный интерфейс для доступа к государственным базам — например, к информации о школах, о лицензированных турагентствах, к всевозможным реестрам, кадастрам и т.д. Получив доступ к этим данным, частный бизнес тут же создал бы десятки приложений для миллионов пользователей. Складывая два и два получаем 4. Скорее всего, не существует каких-то особенно ВУЗовских планов. Образовательные нотки являются лишь небольшой частью большой работы по всеобщему интерфейсу к государственному всему. Гипотеза — внутри белого пятна найденного «Известиями» находится создание глобального госинтерфеса. А не ВУЗовского интерфейса для курсовичков. Теперь к географическим белым пятнам. Как писали на Роеме Турецкий «Яндекс» запустил вчера сервис uni.yandex.com.tr — справочник по вузам в Турции и за ее пределами, предлагающих программы для турецких абитуриентов и студентов. Yandex Üniversite позволяет подобрать вуз в зависимости от количества баллов, набранных на экзаменах вроде российского ЕГЭ, и отсортировать выборку по ключевым параметрам — местонахождению, наличию платных и бесплатных мест, форме и срокам обучения и т.д. Сервис построен на основе общедоступной информации, отдаваемой государственными информационными системами, но структурированный поиск по этой информации до сих пор отсутствовал. Можно предположить, что на турецком рынке с развитым электронным государством «Яндекс» сможет запускать подобные сервисы под разные социальные запросы один за другим, Рунету же пока остается довольствоваться интерактивными графиками отключения горячей воды. В Турции компания работает недавно, а вузовский сервис уже есть. В постсоветских странах Яндекс работает очень давно, но вузовского сервиса нет. Вывод? Правильно. Тут вузы мало что выкладывают и сложны для индексации. Сервис был бы нерепрезентативен, так как покрыл бы лишь десяток, а не сотни или тысячи ВУЗов РФ. Яндекс рад собрать под свой бренд студентов. Это умная или хитрая аудитория, настоящий и будущий средний класс РФ. Но в у каждой страны есть специфика. В РФ студентов не собрать.

  • Контекст комментария

    Глеб Суворов https://t.me/itsocial

    хотелось бы верить. что-то подсказывает, что не только яндекс проиндексирует. и это правильно. потому что «по ощущениям» современная методология написания дипломных работ не отличима от плагиата. только половину(?? не 80% ??) дипломников придется мммм. лишить дипломов. потому что. опять же цены вырастут на «написание дипломовкурсовых» — хоть так поддержим отечественных производителей.

Добавить 31 комментарий

  • Ответить
    Альтер Эго

    Агентство стратегических инициатив (АСИ) подключило к проекту специалистов «Яндекса» для поиска совпадений в раскрываемых работах А где это в Известиях? Там Яндекс вообще не упомянут. Может вы ещё откуда взяли? Проблема будет с определением первоисточника, чего “зеркало рунета” так и не научилось, и не хочет делать в www (низкой скоростью индексации многое определяется). Ну найдутся пересечения, и что дальше? Делить на добросовестное цитирование и на гнусный плагиат? Как? А с фильтрацией дублей у Яндекса проблем как бы нет, хотя грубость методов признаётся даже Щукиным: Ваш сайт сейчас отсутствует в результатах поиска по запросу такому-то, так как алгоритм посчитал его контент идентичным информации, что уже представлена в выдаче. Мы считаем подобную оценку алгоритма не совсем корректной , поэтому будем вносить корректировки в алгоритм ранжирования. Сразу уточню, что подобное изменение алгоритма требует много времени, так как затрагивает не одну конкретную выдачу, а все результаты поиска в принципе. И спамеры давно знают, как это обходить.

  • Ответить

    @Задача, как я понимаю, сложнее чем просто индексация. А что делать с «пересказом своими словами», например?@ Ничего не делать. Большая часть «зачетных работ» при обучении и состоит в пересказе своими словами источников.

  • Ответить

    Робот в любом случае не принимает решения. Он может помогать выявлять случаи, по которым уже кто-то там выносит решения. Либо диссертационный совет, а затем ВАК, либо преподаватель, если речь о курсовой. На этом этапе чаще всего легко понять, кто у кого украл.

  • Ответить
    Альтер Эго

    А что делать с «пересказом своими словами», например? Давайте вернёмся к тому, чем именно занимается система образования. Ну не тем же, чтобы учить думать (этому научить нельзя, зато можно научить обходиться без этого). Вот и будут последствия этой затеи… не лучше, чем у Яндекса.

  • Ответить

    А само Министерство образования и науки следовало бы обязать размещать на своем сайте одобренные Высшей аттестационной комиссией (ВАК) Минобрнауки кандидатские и докторские диссертации, основанные на откровенном плагиате. Например, такие, как http://maxpark.com/user/1220335144/content/643159

  • Ответить
    Глеб Суворов https://t.me/itsocial

    хотелось бы верить. что-то подсказывает, что не только яндекс проиндексирует. и это правильно. потому что «по ощущениям» современная методология написания дипломных работ не отличима от плагиата. только половину(?? не 80% ??) дипломников придется мммм. лишить дипломов. потому что. опять же цены вырастут на «написание дипломовкурсовых» — хоть так поддержим отечественных производителей.

  • Ответить

    Проиндексировать всеми это хорошо. Еще бы и систематизировать, найти взаимосвязи и пр…. Еще бы было не плохо сделать открытый доступ к результатам ЕГ и всех промежуточных тестов школьников и курсовые и пр. студентов…

  • Ответить

    Яндекс был упомянут в публикации в момент её выхода. Я копировал и делился в IM. Одно из включений было дословно такое: Для выявления нарушений в дипломных и докторских работах АСИ подключили к работе специалистов «Яндекса», которые разрабатывают программу, способную проводить проверку на совпадения. Потом эта строчка из Известий «таинственно» исчезла.

  • Ответить
    Альтер Эго

    Так вот как делают колбасу. Фразу сейчас можно найти, её многие скопипастили. Но почему же убрали?

  • Ответить

    Потому что эта строчка обозначает стойку “фас”. ВУЗы засаботируют систему по которой их надо немедленно лишать аккредитации. Публикация утверждает что 30 процентов ВУЗов подключаться сразу. А я сомневаюсь. Мне кажется есть всего несколько ВУЗов в стране, где действительно вычитывают курсовики и работы более высокого класса. А остальные 99 процентов в той или иной доле могут выкатить на индексацию и проверку лишь филиал рефератов.ру. “Преподаватели” только-только освоили блестящие корейские автомобильчики в обмен на дипломы для неговорящих по русски, а тут Яндекс взял и нашёл всё. Кому это надо? Никому.

  • Ответить

    И ещё. Догадываюсь, что ВУЗовские наработки есть у Школы Яндекса. Какой-нибудь не очень замороченный софт для «обработки данных». Например, для автоматической отбраковки плагиата. Возможно, в международных планах Яндекса есть что-то ВУЗовское. За рубежами (в Турции и др) ВУЗы раскрывают больше нужных документов? В РФ они не раскрывают ничего. А по итогам — для биржевой компании допустимо выкатывать только законченное решение. С планами ситуация иная. В самой сомнительной перспективе русские ВУЗы будут индексироваться. Значит владелец Яндекса обязан считать и планы работы с русскими ВУЗами самыми сомнительными и высокорискованными. Такие лучше не раскрывать.

  • Ответить
    Глеб Суворов https://t.me/itsocial

    а если посмотреть проще ? рефераты-курсовики-дипломы представляют собой отличный материал для выявления последнего кадрового резерва. новых кандидатов уже не будет. попробуйте исходить из этой концепции. понятно как это может пригодится яндексу.

  • Ответить

    не вижу выхода из этого исхода: если дружно прикидываться, что реферат студент написал сам (а не скопировал из интернета), то можно принимать от него вполне объемные и качественные (сами по себе) тексты. И при этом требовать их от студента в довольно большом количестве. Если же удастся заставить его самого писать, то выдавить из себя он сможет только «бе-бе-ме-ме». И как тогда этот продукт оценивать?

  • Ответить
    Альтер Эго

    >За рубежами (в Турции и др) ВУЗы раскрывают больше нужных документов? В РФ они не раскрывают ничего. Каждый раз удивляюсь как разные люди видят этот мир. Часть мира просто исчезает из их поля зрения — белое пятно. В РФ значит, ничего не раскрывают ВУЗы.

  • Ответить

    Вообще в заметке и её прочтении, а так же в странном поведении «Известий» — «белых пятен» много. Обозначу контур одного из таких пятен. 15-го октября 2012-го года в Минкомсвязи состоялось заседание экспертного совета по информтехнологиям. На закрытом заседании, о котором известно далеко не всё, присутствовали топы IT-бизнесов. Например, нашего голландского Яндекса, Parallels, СКБ Контура и др. http://roem.ru/2012/10/15/govdata55544/ Если верить «Ведомостям»: гендиректор «Яндекса» Аркадий Волож предложил создать специальный интерфейс для доступа к государственным базам — например, к информации о школах, о лицензированных турагентствах, к всевозможным реестрам, кадастрам и т.д. Получив доступ к этим данным, частный бизнес тут же создал бы десятки приложений для миллионов пользователей. Складывая два и два получаем 4. Скорее всего, не существует каких-то особенно ВУЗовских планов. Образовательные нотки являются лишь небольшой частью большой работы по всеобщему интерфейсу к государственному всему. Гипотеза — внутри белого пятна найденного «Известиями» находится создание глобального госинтерфеса. А не ВУЗовского интерфейса для курсовичков. Теперь к географическим белым пятнам. Как писали на Роеме Турецкий «Яндекс» запустил вчера сервис uni.yandex.com.tr — справочник по вузам в Турции и за ее пределами, предлагающих программы для турецких абитуриентов и студентов. Yandex Üniversite позволяет подобрать вуз в зависимости от количества баллов, набранных на экзаменах вроде российского ЕГЭ, и отсортировать выборку по ключевым параметрам — местонахождению, наличию платных и бесплатных мест, форме и срокам обучения и т.д. Сервис построен на основе общедоступной информации, отдаваемой государственными информационными системами, но структурированный поиск по этой информации до сих пор отсутствовал. Можно предположить, что на турецком рынке с развитым электронным государством «Яндекс» сможет запускать подобные сервисы под разные социальные запросы один за другим, Рунету же пока остается довольствоваться интерактивными графиками отключения горячей воды. В Турции компания работает недавно, а вузовский сервис уже есть. В постсоветских странах Яндекс работает очень давно, но вузовского сервиса нет. Вывод? Правильно. Тут вузы мало что выкладывают и сложны для индексации. Сервис был бы нерепрезентативен, так как покрыл бы лишь десяток, а не сотни или тысячи ВУЗов РФ. Яндекс рад собрать под свой бренд студентов. Это умная или хитрая аудитория, настоящий и будущий средний класс РФ. Но в у каждой страны есть специфика. В РФ студентов не собрать.

  • Ответить
    Альтер Эго

    За рубежами (в Турции и др) ВУЗы раскрывают больше нужных документов? В РФ они не раскрывают ничего. плюс Вообще в заметке и её прочтении, а так же в странном поведении «Известий» — «белых пятен» много. Обозначу контур одного из таких пятен. … Складывая два и два получаем 4. Скорее всего, не существует каких-то особенно ВУЗовских планов. Образовательные нотки являются лишь небольшой частью большой работы по всеобщему интерфейсу к государственному всему. Гипотеза — внутри белого пятна найденного «Известиями» находится создание глобального госинтерфеса. А не ВУЗовского интерфейса для курсовичков. складыва 2 и два получаем, что в России не раскрывается воообще ничего? Вот я и говорю, что сплошное белое пятно. Вот Дума, например, что-нибудь раскрывает? Вы не верите в высокую открытость парламента включая раскрытие информации о доходах, публикацию результатов поименных голосований и API к базе законопроектов? В Турции компания работает недавно, а вузовский сервис уже есть. В постсоветских странах Яндекс работает очень давно, но вузовского сервиса нет. Вывод? Правильно. Тут вузы мало что выкладывают и сложны для индексации. Выводы? Ильин умеет строить красивые теории по минимальному набору фактов. Давайте попробуем посмотреть насколько это связано с реальностью. Сложно говорить по каким причинам Яндекс не сделал такой сервис в России, не имея информации из самого Яндекса. Что же до общедоступной информации из ВУЗов, то есть http://abitur.nica.ru/ http://www.ucheba.ru/vuz/?action=filter&e=1 http://www.hse.ru/ege/second_section2012/ почему они это смогли, а яндекс нет? зачем, что присутствуют все указанные выше параметры количества баллов, набранных на экзаменах вроде российского ЕГЭ, и отсортировать выборку по ключевым параметрам — местонахождению, наличию платных и бесплатных мест, форме и срокам обучения и т.д. ВШЭ даже делает ежегодный [url=http://www.hse.ru/ege/first_section2012/]Мониторинг прозрачности сайтов российских вузов для абитуриентов[/url]

  • Ответить
    Альтер Эго

    Это приведет к несомненному повышению качества науки в РФ! Ученые будут знать, что их диссертации могут быть найдены посредством сети интернет и будут писать лучшие диссертации. Мало того не надо теперь ездить на конференции и посылать статьи в программные комитеты. Качество научной продукции будет определяться числом длинных «щелчков» на диссертацию, а значит и местом в рейтинге Яндекса. В скором будущем ученые будут обязаны немедленно публиковать свои результаты в сети интернет по мере того как результаты приходят в голову, чтобы интернет общественность могла их обсудить, решить верны ли они и имеют ли научную ценность. Ученые будут обязаны публиковать результаты в твитере, обязуюсь делать их понятными простому интернет люду в 144 знаках, чтобы массы интернет юзеров могли понять современные достижения науки не тратя время на длинные определения и замутные объяснения. Слава Интернету!

  • Ответить

    Нет, идея другая. Задумка — военная. Зная любовь наших восточных “друзей” из Китая к штудированию вузовских материалов — принято решение завалить их творчеством наших не умеющих писать “студентов” и талмудами не говорящих по-русски “академиков”.

  • Ответить

     > А почему ни слова о антиплагиат.ру? Система уже давно развернута и работает, почему надо все по новой и яндексу отдавать? Антиплагиат не работает от слова «совсем». Даже сейчас через Яндекс проще обнаружить факт и источник плагиата, чем через этот самый антиплагиат.

  • Ответить
    reklama co-founder

    Как представитель одного из проектов посвященного высшему и последипломному образованию могу сказать, что сайты наших ВУЗов это нечто. На большинстве из них достаточно сложно вообще найти какую то информацию. То есть речи о создании какого то сервиса в который будут отдаваться данные вообще не идет. Если в Москве более или менее все понятно, то чем дальше от центра тем хуже ситуация. Самый отжиг начинается при просмотре сайтов институтов силовых ведомств. Все что мы собирали приходилось править руками и дважды перепроверять. По этим же самым причинам я очень сомневаюсь в создании единой базы дипломов и курсовых. По поводу антиплагиата недавно было интервью со студентами, которых якобы поймали при помощи нее за компиляцию с других работ. Так вот, все замечательно обходится. Заменяем русскую «а» на латинскую «а» и по аналогии остальные буквы. Вуаля, у Вас диплом со 100% уникальностью.

  • Ответить

    > Заменяем русскую «а» на латинскую «а» Яндекс такими ухищрениями не возьмешь: ищет слово как родное. Антиплагиат все равно ничего не ищет, что с заменой букв, что без.

  • Ответить
    Михаил Сергеев КиберЛенинка

    Мы в http://cyberleninka.ru занимаемся этой задачей уже некоторое время и «на практике». Но пока что попытки договариваться с ВУЗами не привели ни к какому результату — никому ничего не надо. Если кто готов помочь — пишите.