Невостребованные пираты, утопающие в деньгах

...сделать может каждый, а вот отчёт написать...

Неназванный участник конференции

Команда КиберЛенинки только что вернулась с прошедшего в Крыму Второго Международного профессионального форума «Книга. Культура. Образование. Инновации»  («Крым–2016»). Время было проведено с пользой: мы представили несколько докладов о нашем проекте и открытом доступе, в том числе на Дне Министерства образования и науки РФ. Много времени было уделено формальному и неформальному общению с представителями библиотечного сообщества России.

Большинство участников подчёркивали необходимость и важность работы КиберЛенинки, но вместе с тем некоторые из них озвучивали сомнения, которые мы условно разделили на три группы: невостребованность, пиратство, деньги. Тон для бесед в кулуарах задал в основном круглый стол, посвященный целиком и полностью Национальной электронной библиотеке (НЭБ). В ходе обсуждения чиновники активно ставили под сомнение данные доклада ЦЭМИ РАН, сравнивающего модели доступа НЭБ и КиберЛенинки.

Невостребованность

По мнению многих экспертов из обоих Министерств (культуры и науки и образования), посещаемость КиберЛенинки, мягко говоря, не соответствует действительности. Три миллиона человек в месяц и 22 млн за прошедший 2015-й год — нереальные и просто запредельные цифры. Цитата одного из участников: «Понимаю, что все библиотеки завышают свою посещаемость, но вы, ребята, накрутили слишком много».

Статистика КиберЛенинки в отличие от статистики многих библиотек является общедоступной, и любой желающий может с ней ознакомиться. Например, воспользовавшись системой статистики, созданной под руководством Советника Президента РФ по проблемам интернета и Председателя Совета Института развития интернета (ИРИ) Германа Сергеевича Клименко.

КиберЛенинка_2

Посещаемость за год, источник: LiveInternet

КиберЛенинка_3

Посещаемость со старта проекта, источник: Яндекс.Метрика

Также у нас имеется верифицированная статистика на SimilarWeb, где доступно сравнение аудиторных показателей с НЭБ.

Более того, в апреле текущего года по заказу Фонда развития интернет-инициатив (ФРИИ) экспертами Центрального экономико-математического института Российской академии наук (ЦЭМИ РАН) был выпущен отчет, в котором даётся сравнение Национальной электронной библиотеки и КиберЛенинки. Особое внимание уделяется посещаемости обоих ресурсов — государственного проекта и общественной инициативы. При схожих объёмах фондов (примерно 1 млн у КиберЛенинки и 1,6 млн единиц хранения в НЭБ) по посещаемости КиберЛенинка превосходит НЭБ более чем на порядок.

КиберЛенинка_4

Сказ о том, как сезонные колебания обошли НЭБ стороной

Пиратский ресурс

На Форуме активно высказывались мнения (особенно от представителей Министерства культуры РФ) о том, что КиберЛенинка является пиратским ресурсом, и никаких соглашений с правообладателями у нас нет. Интересно, что данный тезис озвучивался теми же экспертами, которые сетовали на невостребованность КиберЛенинки. Обычно пиратские ресурсы напротив очень популярны и имеют высокую посещаемость, однако парадоксальность собственных выводов ничуть не смутила профессионалов.

За всё время работы нами заключено безвозмездных лицензионных договоров на более чем 1000 научных изданий. С проектом работают 14 вузов из Проекта 5-100 и более половины вузов из первой сотни (по рейтингу Интерфакс). Только с начала 2016-го года заключены договоры с 242 научными журналами, среди которых издания СПбГУ. Было бы странно видеть крупнейший госвуз страны анонсирующим сотрудничество с пиратами.

Более того, было получено заключение от ведущего юриста в области авторского права в России Саркиса Дарбиняна о легальности коллекции КиберЛенинки. С типовым договором, заключаемым на безвозмездной основе, можно ознакомиться здесь.

Много денег

У библиотечного сообщества сложилось стойкое впечатление о финансовой стабильности проекта. После доклада на Дне Минобрнауки РФ мы стали получать предложения следующего содержания: «А давайте потратим деньги на субподряд, у вас их явно много!».

Более года назад мы описывали наши мытарства в поиске средств на поддержу проекта в статье «11 способов, с помощью которых вы можете попробовать достать деньги на некоммерческий проект. К сожалению, за год ситуация не изменилась. На текущий момент ни одна коммерческая или государственная организация не потратила ни рубля на проект. За все время существования КиберЛенинки (более четырёх лет) нами были получены 600 тыс. руб. Все средства были предоставлены некоммерческими негосударственными организациями, которых на самом деле всего две — это «Информационная культура» и «Ассоциация интернет-издателей».

И на последних итерациях общения прозвучал тезис о том, что ни Минкульт, ни Минобрнауки не считают нужным поддерживать проект, но планируют пользоваться его результатами. Цитируя источник — «зачем платить деньги за то, что и так бесплатно».

КиберЛенинка_5

Нет и не будет

Между тем, серверные мощности РГБ перестали справляться с чудовищным трафиком НЭБ и для решения этой насущной проблемы компания Оберон построила ещё один ЦОД специально под НЭБ. К сожалению, найти контракт на “открытый конкурс” о котором говорится в пресс-релизе нам не удалось.

На фоне всех этих несуразиц внушают оптимизм положительные моменты. В последнем докладе ЮНЕСКО, посвященном открытым образовательным ресурсам, ”Open Educational Resources: Policy, Costs and Transformation”, КиберЛенинка приводится как пример инициативы по использованию открытого лицензирования научных публикаций. И нам бы очень хотелось, чтобы чиновники наших министерств в оправдание своей некомпетентности при разработке НЭБ не занимались принижением результатов нашей работы или манипуляциями с целью её очернения (вывода из правового поля), а, напротив, ради общего блага поддерживали и развивали свои и общественные начинания.

Добавить 30 комментариев

  • Ответить
    Олег Яшин Русский Щит

    >> Более того, было получено заключение от ведущего юриста
    >> в области авторского права в России Саркиса Дарбиняна
    >> о легальности коллекции КиберЛенинки

    Это прекрасно. Куда ведет Саркис (если он ведущий) мне сказать сложно. Тут больше подошел бы эпитет «известный».

    А известный он прежде все тем, что защищает пиратов на уголовных процессах (по тем же Лопуховым оправдания не было, они признаны пиратами, но Саркис добился существенного снижения наказания), пытается опротестовать решения суда о блокировки пиратских сайтов и тем, что является юристом незарегистрированной Пиратской Партии России.

    И с научной точки зрения получать от него заключения о легальности контента — это оксюморон, т.к. он конечно же считает легальной и деятельность Лопуховых, и некоммерческое распространение пиратской продукции (в рамках работы по проекту реформа цифрового права и пиратской партии), и деятельность заблокированных МосГорСудом пиратских сайтов (если я не ошибаюсь, ни одно из решений МГС о блокировке по пиратке он так и не отменил).

    Михаил, Вы несколько странный критерий легальности контента выбрали. Это при всем уважении к Вам лично и КиберЛЕнинке, и не меньшем уважении к Саркису (он и Артем — мои наиболее подкованные и приятные оппоненты во многих дискуссиях).

    Если хотите произвести впечатление и иметь научное обоснование — лучше получить заключение в нейтральной организации, не занимающей позиции ни защитника копирайта, ни защитника пиратов.

  • Ответить

    Спасибо, Олег. Ссылка на наш типовой договор есть в статье, любой юрист может сделать свое заключение. У Саркиса, на мой взгляд, да и по вашим словам, есть некая практика.

    В конце статьи упоминается ЮНЕСКО, там конечно не совсем заключение-заключение, но помоему эта организация достаточно нейтральна.

    В любом случае, если у вас будет возможность сделать заключение и с вашей стороны — это будет очень нужная информация.

  • Ответить

    Не важно, что вы делаете — все равно найдется тот, кто кинет в вас камень. А если вы достигаете в своем деле успеха — количество бросателей камней возрастает кратно.

  • Ответить

    После прочтения у меня появись два вопроса:
    1. Сколько стоит свозить в «Крым» команду?
    2. Зачем тратить на «Крым» денег больше, чем всё заявленное финансирование, если команда так и не поняла, в чем основные претензии сообщества, либо, поняла. но отводит от этого глаза очень неумело?

  • Ответить

    В принципе, нам повезло, что сейчас в стране есть Киберленинка и НЭБ. Очень хочется верить, что оба проекта найдут возможность реализоваться. Правда, легко представить, что Киберленинку потопят, а НЭБ так и не сможет стать проектом по сквозном доступу ко всем библиотечным фондам России, как он задумывался. Но верить то хочется в лучшее. Например, что Киберленинка организует попечительский совет, который сможет лоббировать интересы проекта, а НЭБ преодолеет бюрократическую инертность и объединит в единый каталог библиотечные фонды и обеспечит доступ к ним.

  • Ответить
    Михаил Сергеев КиберЛенинка

    Alex, забавно, что вы зарегистрировались только ради этого комментария. И судя по его тону у вас припекло ;). По сути самого вопроса ответ простой — денег мы не тратили, нас пригласили на секцию МоН.

  • Ответить

    Стратегическое поведение представителей Киберленинки по отношению к крупным институциональным репозиториям по меньшей мере удивляет. Передёргивание фактов (нормально так сабж сравнивать с репозиторием Белгородского университета, который в общем скорее неактивен), откровенно агрессивное поведение, неделание учитывать интересы коллег, которые «на рынке» значительно дольше вас и действительно имеют финансирования ноль, имеют место быть.

    И при этом вас еще и пожалеть надо?:) Увольте…

    Не прикипело, просто ваша бизнес-модель мешает работать :) И к диалогу вы не открыты совершенно. Кому-то вы помогаете (обычно тем, у кого выбора нет), а кому-то вы не нужны. С этим нужно смириться.

    P. S. А где бравада о том, что некий Нск отскочил?:) Дескать мы тут молодцы, но к нам ВУЗы не только приходят, но и уходят…

  • Ответить

    Сквозной доступ? Библиотечные фонды?:) Пока речь идёт о том, чтобы агрегировать современные журналы/конференции, не более. При этом только агрегировать, но не продуцировать контент. OCLC WORLDCAT есть уже много лет, и там порой можно найти то, чего в Киберленинке не будет скорее всего никогда. Просто политика у ресурса другая, и задачи.

    Да, мы ведь сейчас об академических библиотеках говорим, не о муниципальных? Хотя в любом случае, сейчас речи даже о каталоге не идёт сквозном, не говоря уже о фондах.

  • Ответить

    Alex, в Worldcat Киберленинка индексируется, если вы не знали вот пруфлинк
    http://www.worldcat.org/search?q=cyberleninka.ru&qt=results_page

    Ребята в Киберленинке — грамотные. И проект отличный. Наши студенты и сотрудники часто ходят туда, видим переходы с сайта библиотеки в Киберленинку. Мы и сами по договору 5 журналов размещаем.

    Удачи проекту.

  • Ответить

    Я это заметил, причем достаточно давно :) И появление в OpenDOAR заметил, а уж появление в OpenAIRE незаметить было нельзя… хоть и не первые они там были из РФ, и даже не десятые :) Да и не то, чтобы совсем из РФ.

    Разговор не об этом. разговор о том, что Вам это удобно и Вы этим пользуетесь… по договору. А нас в общем заставляют :) И заставляет то в общем министерство, но по правилам сабжа. Выбора нет, диалога нет, явных профитов нет. А вот передёргивания и отведение глаз от очевидного есть :)

    WorldCat не «отжимает» визабилити у источника и всячески его, источник, пиарит. Ворлдкат — лишь форма готового содержания и путь к источнику всегда открыт. В сабже такого нет и близко :) зато в сабже есть много доводов в пользу того, почему институциональные репозитории не должны быть :)

    P. S. Буквально часов 6 назад обновил фид БНТУ в worldcat ;) без договоров :)

  • Ответить

    Ха! Вот почему-то мне так и показалось, что мы знакомы:))

    А как заставляют-то. Я не встречал никаких просьб от Минобрнауки всем идти в Киберленинку.

  • Ответить

    а они есть, просьбы… :(

    В общем, еще раз хотел заострить внимание на том, что не считаю сабж пиратским ресурсом, не считаю излишне богатым (но и прибедняться не нужно), а что до востребованности… проблема не в ненужности, кому-то оно может и нужно, проблема в навязывании одними, и нежелании сделать это навязывание максимально безболезненным, другими.

  • Ответить

    Штука в том, что в НЭБ сейчас книг нет, все что есть хранится в библиотеках, а не НЭБе. В целях создания централизованного хранилища под книги региональных библиотек генпорядчиком запланирована (а может уже и выполнена) поставка 2 (двух) серверов. Надо полагать, по 600 Вт каждый. И этого достаточно.

    35кВт ЦОДа в этом плане доставляют неслабо и все это говорит только о том, что ЦОД построен под задачи РГБ, а вовсе не НЭБа.

  • Ответить

    А на каком уровне министерство заставляет идти в КиберЛенинку?
    И если выбирать между ростом цитируемости статей и рейтингом в вебометриксе, лично я бы на месте и Минобрнауки и на месте проректора по науке предпочёл бы цитируемость (максимальную видимость).
    А Вебометрикс — это такой рейтинг, который должен быть интересен исключительно PR-отделу ВУЗа с точки зрения навешивание лапши абитуриентам, авось не станут разбираться что этот рейтинг измеряет :)

  • Ответить

    МОН учитывает ссылки с сабжа в отчетах по НИР и еще где-то, в общем, можно найти документ. Кто пролоббировал интересы именно сабжа — вопрос десятый. Первый вопрос — появляющиеся в связи с этим сложности на стороне ВУЗа сабж решать не хочет.

    Что касается вебометрикса — это достаточно удобный инструмент для оценки себя и себя в мире. На PR отдел в общем пофиг, у них и ARES есть и пр. плюшевые инструменты для бравад, а теперь еще и QS по областям, так что, именно вебометрикс, у страивающий маленький бунт со сменой правил раз в год, а никакая не открытая яндекс метрика (которая в случае классический репозиториев не объективна чуть более чем полностью) является субъективным, но приемлемым инструментом для оценки собственной работы.

  • Ответить
    Михаил Сергеев КиберЛенинка

    Alex-аноним, если вы так давно «на рынке», делаете все бесплатно, то можете мне как-то объяснить почему у нас такой бардак в информационном обеспечении научной деятельности? Почему мы вообще как проект работаем? Откуда читатели (трафик), если все так круто было до нас? И самое главное, если кто-то еще стал бесплатно делать вашу «бесплатную работу», то это же замечательно, разве нет?

    Что же про Webometrics, то вся эта возня «ради рейтинга» когда ВУЗы боятся отдавать в ту же ИСТИНУ данные, чтобы «не прокачивать МГУ» — это такой край бреда, что жить ему осталось совсем недолго.

    Ваш пассаж про Яндекс.Метрику, которая «не объективна» для «классических репозиториев» — это просто отвал башки! Т.е. вы угораете по Webometrics, который обсчитывает SEO-метрики, а главный итог SEO — трафик у вас не объективный показатель, Исидро будет в восторге. Такая логика хорошо зайдет в русле НЭБа.

    Ну и «ода» WorldCat и ко показывает уровень постановки задачи, понимания проблематики и вообще того «для чего вы делаете свою работу» — просто потому, что эти системы не являются инструментами донесения знаний до конечного пользователя. Это «отчетные базы», и пользуются ими полтора человека.

  • Ответить

    Держите себя в руках, прекратите истерику. Я не говорил что на сабж никто не ходит и что сабж занимается накрутками, но Вы почему-то слышите именно это.

    Яндекс метрика в отличии от гугл аналитики в общем не в состоянии посчитать прямые клики на ПДФ-ки (даже из яндекса при связи метрики и вебмастера), которые в классических репозиториях имеют место быть очень часто. Т.е. яндекс метрика НЕ видит многих «живых» посещений. С роботами в общем аналогичная ситуация. Недавно я показывал коллегам картинки как один scrape ресурс генерировал по 6 миллионов запросов в день на репозиторий объёмом 4 тысячи заглавий… яндекс молодец, яндекс посчитал :)

    Поэтому я считаю мериться яндексом не очень хорошей затеей. Исидро делает работу чуть более комплексную, субъективную, но комплексную. И SEO (визабилити) там далеко не единственный показатель.
    Когда я предложил коллегам меняться не яндекс метрикой, а логами веб сервера, все как-то притихли, а я в общем свои логи отдаю :) И десятки миллионов роботов там видно и миллионы живых хитов. Только вот не уверен, можно ли легально использовать для представления логов мой личный Sawmill… надо перечитать EULA.

    P. S. Для тех кто в теме давно, я не аноним :) Вы же можете звать меня Alex. Поймите, я не настроен враждебно по отношению к сабжу, мне в общем всё равно, и даже некоторое лице… скажем, лицедейство, практически не волнует.

  • Ответить

    Михаил, да, Alex не аноним, это точно.

    По поводу Я.Метрики — поддерживаю, что количество прямых кликов на pdf она действительно не считает.

  • Ответить
    Михаил Сергеев КиберЛенинка

    «Я не аноним, но для вас я аноним», ну ок.

    Про измерения — не важно чем «мериться», если у всех используется один и тот же инструмент, то и ошибаться он будет для всех одинаково.

    То мы вам бизнес поджали, то вам все равно, то «не накрутки», то «лицедейство». Какой-то фарш. Sawmill, EULA, миллионы, инновации, НТИ!

  • Ответить

    Я сказал ме-нять-ся. Не ме-рить-ся. Еще раз по буквам, м-е-Н-я-т-ь-с-я. Мериться в общем не интересно. Меряются те, кому срочно нужно что-то кому-то доказать, или что-то опровергнуть.

    Мне вот было интересно как много в сети неадекватных краулеров, которые генерируют по 40−50 гигабайт аксесс лога в сутки, никто моего интереса не разделил :) Но я не в обиде.

    Арсен выше предложил классную мысль в общем. Давайте мериться киловаттами цода? В общем достаточно объективно, и так же близко к телу как яндекс метрика.

    P. S. Заявления про поджатый бизнес списываю на истерику и мерещащиеся там, где их нет, буквы.

  • Ответить
    Михаил Сергеев КиберЛенинка

    Перечитайте, то что вы сами пишете, всем известный Alex:
    «Поэтому я считаю мериться яндексом не очень хорошей затеей»
    «ваша бизнес-модель мешает работать»

    Вы как-то странно строите диалог, опускаете неудобные вопросы, везде истерика, и при этом вам кажется уместно разбавлять это все какой-то «экспертной водой» на общие темы.

    Про фиксацию на Я.Метрике — в статье же специально даны еще два источника данных, и они коррелируют с Метрикой.

    Я вообще стал замечать что «загоны» на Метрику это модно у пилильщиков. Мол, не та отчетность, какую бы надо. Может быть вам написать статью на Роем про то как Яндекс.Метрика врет, с конкретикой и по пунктам. Представители Яндекса читают Роем и реагируют, думаю у вас получится замечательный кейс. Но мне почему-то кажется, что вам любой экспертный диалог, мягко говоря, некстати.

    P. S. Наша с вами беседа конструктива не несет, да и мне надоело истерично лицедействовать, поэтому я заранее извинюсь перед вами и на следующий ваш комментарий не буду отвечать. Сделайте его красивым.

  • Ответить

    Раз пошла такая пьянка
    https://metrika.yandex.ru/stat/downloads?group=week&selected_rows=f9xt2I&period=2015−01−01%3A2016−01−01&id=12241775
    Вот статистика по загруженным файлам за 2015 год из нашего репозитория
    - 132 102
    Связка гул аналикикс и гугл вебмастер показала нам, что за это время было скачано более 1 200 000 файлов.

    Если еще и копаться в логах- цифра будет больше.

  • Ответить

    Почему бы не обвешать проект Адсенсом и Диретом? Уже бы 200 000 было, уже можно смело идти во ФРИИ. Они там раздают миллионы. Потом на эти миллионы купить. продать. опять в оборот.

  • Ответить

    Если говорить про применимость Я.Метрики и остальных, то действительно, мне не очень понятно как считать скачивания PDF-ов при клике на ссылке по ним. Но это не суть, это проблема, строго говоря, DSpace, CMS с ссылками на PDF и подобных подходов, когда считают, что плеер не нужен, а нужна ссылка на PDF.

    Это проблема легко могла бы быть исправлена создателями DSpace. Но им это не интересно. Подозреваю, что Alex тоже мог бы исправить эту проблему в своем зоопарке, но ему это тоже не настолько интересно и проще логами вебсерверов меряться -).

    Меряться сырыми логами — это конечно не катит в том смысле, что метрика дает гораздо больше информации и она работает на клиенте. Более того, логи имеет смысл сравнивать только в рамках одинаковых систем с одинаковыми настройками логирования. Открыть логи всему миру — это да, это можно. Но сравнивать совершенно разные системы по активностям в логах — увольте.

    Более того, логи будет правильно еще и обезличить. Не совсем хорошо открывать всем желающим ip-адреса и чем их пользователи интересуются.

    Но вся соль именно с КиберЛенинкой и другими библиотеками с книжными плеерами — что трафик прет не на PDF, а на страницу с плеером и статистика на JS дает вполне адекватные результаты, которыми можно и нужно меряться.

    Если несколько статистики работающих на JS дают близкие результаты — это означает, что система не подвергалась накрутке левыми ботами, т.е. эту претензию можно устранить.

  • Ответить

    Ну и вообще, речь ведь не о том, идеально внешняя аналитика или нет.

    Речь о том, что чиновники и руководители с сотрудниками федеральных библиотек пытаются оправдать свою собственную профессиональную некомпетентность черным пиаром успешных независимых проектов.

    И если сейчас все это проглотят и за язык Вислого и компанию не подтянут, то так и будут наши с вами налоги уходить на непонятно что.