Новый глава «Ростелекома» подхватил традицию Калугина раз в год переосмысливать «Спутник»

Развитие событий: Клименко, Делицын, Засурский — почему провалился «Спутник»? (13 мая 2017)

Несколько человек, близких к «Ростелекому» и знакомые сотрудников оператора рассказали «Ведомостям», что до 1 июня президент оператора Михаил Осеевский примет решение о будущем проекта «Спутник». Закрытие маловероятно, — утверждает человек, представленный как знакомый менеджеров «Ростелекома» — возможно «Спутник» переориентируют «на задачи, связанные с расчетом больших данных». «Спутник» занимается Big Data-проектами Ростелекома с 2015 года. Представитель «Ростелекома» Андрей Поляков подтвердил, что планы пересматриваются: «Необходимо будет внести коррективы, соответствующие действительности. Компания хочет повысить эффективность и снизить расходы».


На площадке РИФ+КИБ 2014 вице-президент Ростелекома Алексей Басов оценил затраты на создание «Спутника», на тот момент, ниже затрат, например, на GetTaxi. 3 года назад Gett потратил на себя $52 млн. «А что сильнее повлияет на жизнь населения страны — жизнь рассудит», резюмировал в 2014-м Басов.


Ростелеком запустил «Спутник» на Петербургском международном экономическом форуме в мае 2014 года, но работу над проектом несколько энтузиастов начали ещё в 2008 году. Ростелеком поддержал их инвестициями в 2012-м (И. Ашманов о сделке и её предыстории) и позднее предположил, что «Спутник» мог бы стать сервисно-поисковым порталом, «который сделал бы жизнь рядового гражданина легче». «Дочки» «Ростелекома» «РТКомм.ру» и «Ростелеком интернэшнл лимитед» владеют 74,99% ООО «Спутник», остальное принадлежит Вячеславу Рудникову и Василию Васину. Сейчас, как указано на сайте, развитием поисковика занимается напрямую ПАО «Ростелеком».

В 2015 стратегия поменялась и оператор решил сделать из «Спутника» маркетинговый инструмент, адаптированный под абонентов Ростелекома. За 2016 год небольшая посещаемость «Спутника» упала в два раза, в июне владельцы снова изменили мнение и увидели перспективу в создании проектов для государственных и окологосударственных структур.

В активах «Спутника» алгоритмы машинного обучения и умение работать с большими неструктурированными данными, считают собеседники «Ведомостей». По их словам технологии «Спутника» действительно применяют в инфраструктуре электронного правительства (Ростелеком продавал «инфраструктуру электронного правительства» с 2010 года, то есть прямого отношения к «Спутнику» у неё не было; в 2016 году Счётная палата РФ сомневалась, что оператор работал над «электронным правительством» эффективно). Ещё одна работающая технология «Спутника», говорят собеседники «Ведомостей» — анализ оттока аудитории.

Лучшие комментарии

  • Контекст комментария

    Игорь Ашманов Сам себе компания

    Я уже писал здесь не один раз, в том числе недавно, про историю появления проекта «Спутник» в 2008 году, начавшуюся с попытки Мильнера и Усманова летом 2008 купить долю в Яндексе, похода Геры Клименко к Суркову со срезами раздачи новостного трафика новостными агрегаторами во время войны 08.08.08 и итоговой покупки КМ-Онлайн под этот проект.

    Я тогда (осенью 2008) писал «наверх» докладную записку, в которой рассматривал существующие в РФ коллективы, проекты и технологии в области поиска и делал в ней вывод, что если и покупать — то Рамблер, который в этот момент имел поисковик отличного качества, относительно недорогой и уже работающий.
    КМ-Онлайн я категорически не рекомендовал. У них поиска фактически не было, на портале KM.ru стоял Гугл.

    Про Спутник в этом обсуждении нужно понимать следующее:

    а) его пока никто не закрывает, вы читали невнимательно;

    б) новый президент Осеевский по приходу в РТ увидел в PnL проблемный актив, который жрёт деньги, вызывает репутационные потери, не показывает перспектив.

    Ровно в такой же ситуации несколько лет назад чуваки из Афиши, поставленные владельцами рулить холдингом Рамблер, поспешно уничтожили поисковик Рамблера, чтобы не нести ответственности за то, в чём они не разбирались.

    в) Так что мотивы понятны, Спутник могут и закрыть. Но могут и нет — потому что дело политическое.
    Закрыть его или хотя бы придушить в последние годы старался и предыдущий президент РТ, по тем же мотивам (убытки, непонятность, неприятие, политические проблемы). И не закрыл. Хотя и придушил.

    г) Построить коммерческий поисковик, занимающий заметную долю рынка из Спутника в данных условиях было нельзя.
    Тут где-то пишут про 20 миллионов долларов, где-то про два миллиарда рублей и т.п.
    Это совершенно негодные ресурсы.
    В Спутнике работали в лучшие годы 150-200 человек. У Яндекса только ядро пишут больше народу.
    200 человек — это 300 миллионов рублей в год. Ну 500 с офисом. Это копейки. У Яндекса $500М, больше в 60 раз.
    Там порядка 2000-2500 серверов, это вообще смешно (у Яндекса 100 000+).
    Так поисковик не сделать.

    д) Как правильно пишет Ильин (и как я писал здесь ещё несколько лет назад), из Спутника надо было делать — и по-прежнему надо делать — ответственный государственный поиск, дающий доступ к:
    1) ответственной, чистой, проверенной информации, с гарантированным качеством, отфильтрованной, без порно и грязной коммерции,
    2) к информации, к которой нет доступа у коммерческих поисковиков (государственные базы данных, госуслуги, национальная библиотека и т.п.).
    И это возможно, но не за 500 миллионов в год.

    е) Почему это не могут делать российские коммерческие поисковики? Ну потому что это не вполне российские, не вполне контролируемые компании, с коммерческими интересами и т.п.
    Они сейчас ведут себя сильно лучше, чем в 2008-2012, но недостаточно, там акционеры, антиправительственная тусовка хипстеров и т.п.
    Их тоже надо поддерживать, конечно, и ограничивать законодательно иностранные ТНК (уравнивать рыночные условия), это понятно.

Добавить 53 комментария

  • Ответить
    Альтер Эго

    > Ещё одна работающая технология «Спутника» — анализ оттока аудитории
    Весьма символично

  • Ответить

    Чем прекрасна ит-сфера, так это диверсификацией. Провалил одно направление, всегда можно сказать, что в другой уж точно всех опередим. Особенно, когда это оплачивают налогоплательщики. Это же не стейкхолдеры, чтобы им отчеты подавать.

  • Ответить

    Даже Клименко не котирует Спутник:

    «Если поднять комментарии всех участников нашей индустрии в момент создания «Спутника», то мы поймем, что ничего нового для нас не произошло. С момента создания этой поисковой системы было понятно, что в части сервисов — это мертворожденное дитя. Чтобы сделать качественный продукт требуются миллионы человекочасов, на рынке нет ни людей, ни зарплат, которые могли бы позволить это делать.

    Можно было закрывать проект уже в прошлом году, но хорошо, если у Ростелекома сейчас хватит мужества признать, что продукт неудачный и просто его прикрыть. Можно ли его переориентировать? На мой взгляд, нет. Интернет-продукты не сразу входят в фазу серьезной эксплуатации, потому что это вызовы, постоянные доделки. То же самое с браузерной историей: в «Яндексе» несколько сотен человек работает над браузерами, в «Спутнике», я думаю, работает максимум человек 50.»

    https://thequestion.ru/questions/262575/pochemu-provalilsya-rossiiskii-gospoiskovik-sputnik

  • Ответить

    Особенно, когда это оплачивают налогоплательщики.

    Каким же образом это оплачивают налогоплательщики?
    Вы не злоупотребили пятницей?
    Вообще должно быть стыдно такие вещи повторять — уже последние лет десять.

  • Ответить

    Извините, если я что-то не понял. Но тогда прошу разьяснений.
    «Крупнейшие акционеры «Ростелекома» — Российская Федерация в лице Росимущества (48.71 % обыкновенных акций) и Внешэкономбанк (4.29 % обыкновенных акций)». Как я это понимаю: активы РФ это деньги налогоплательщиков и ребята из росимущества зп тоже получаютиз бюджета (я там работал, к сожалению знаю точно:))..

  • Ответить

    пичалька… так я ниразу и не зашол на этот спутник. все собирался собирался.. а так доказывали, помню, в статьях и призывах, что это будет такой специальный поисковик для госструктур, потом всякие анализы бигдат (куда секертарша иванпетровича в рабочее время заходила в интернете и что ей можно продать или, допустим, объявить выговор)…
    Думаю, надо проявить настойчивость, снять еще одни последние штаны и поддерживать проект еще лет десять. А вдруг гугель загнется ( там и кризис как нам говорят и доллар вотвот рухнет и может Трамп отчудит и закроет гугель) и тогда тут бац — и все ломанутся.

  • Ответить

    Ну и говно. Интересно, будут ли посыпать голову пеплом все те кремлеботы, которые тут за эти «спутники» топили. Ну конечно же нет, а ещё нам уже нагнали новую партию ботов.

  • Ответить

    Это уже 700 раз говорилось, но можно и по 701 кругу, окей.
    Если предположить, что государственный поисковик нужен (или «может» существовать) то…
    Автохтонному населению и гостям страны не надо раздавать госпоисковик, как разновидность Google / Яндекса. С негосударственным поиском они и сами (не) справляются, на свои собственные деньги. Третий такой же прекрасно сделают в Mail.ru, на собственные деньги Mail.ru.
    Государственный поисковик — это поисковик, который не вредит, в понимании 2 и 18 статей Конституции РФ, и, по возможности, помогает. Такой поисковик не должен быть больше, чем государство. Поэтому индексировать офигенно важные сведения о том, когда же «умер» «Дима» «Билан» и какое кино идёт в соседнем кинотеатре — ему ваще не надо. Надо другое.
    Например, в ответ на запрос «Чирий на жопе» — выдача госпоисковика должна найти статейку _врача_ (признаваемого врачом в глазах государства), а не колдуна, о том, что: «держи жопу в чистоте», «протирай календулой», ну или чем-то. Если «чирий на жопе» входит в число симптомов, какого-нибудь заболевания с тяжкими последствиями — госвыдача должна предупреждать, что дела-то плохи, вот формочка записи к «такому-то» врачу в вашем городе. Если ответа нет — госпоисковик должен и писать что произошло: «в глазах государства ответа на этот вопрос нет», совсем нет, негосударственное дело, или сейчас нет, а коммерческий поисковик напротив постарается найти хоть что-то, например малозначимую чушь. Если запрос подразумевает решение какой-то документально оформляемой задачи — то в выдаче должны быть действующие редакции соответствующих законов и норм, и публикации, которые основаны на действующих нормах, а не балабольства общего плана о хреновом Навальном уголовнике и таком же его оппоненте и его дочках.
    Задача разработчика госпоисковика — это не индекс как у гугла и гугловский принцип ранжирования, а полное соответствие «государственной задаче», как её задаёт для властей 2 и 18 статьи Конституции, и формирование принципов, по которым что-то может попасть в индекс под ответственность кого-то. Конкретного. Или не попасть вообще ни под каким видом. Популярная болтовня «о магии» алгоритмов тут не прокатывает. Это Яндекс может сказать, что новости выбирают алгоритмы, а людей ответственных за алгоритмы не существует. Типа: «а, вот, магия!» Госпоисковик может сказать, что. Ну, например:
    Оформление имущественных отношений — входит в число вменённых обязанностей государства. Поэтому материалы о том, как продать, купить, какие налоги, кто несёт ответственность — в госпоисковик попали. Федеральные действуют там-то, там-то, муниципальные – тогда-то, тогда-то.
    Оказание предпочтений одним вкусам или идеологии — для государства запрещено. Поэтому портал с фильмами, которые нравятся министру Мединскому — идёт нахер (идёт в индекс Яндекса/Google), хотя министр и Мединский, а его портал называется типа патриотично.

  • Ответить

    Задача на самом деле вообще непосильная совсем. Но. Это в частной жизни есть бесконечное число занятий. В глазах государства, государство занимается конечным числом задач. Если госпоисковик начнётся с того, что решит хотя бы некоторые задачки, а не все — уже хорошо. Кому плохо, если будет поисковик с медицинским, признаваемым государством за «медицину» индексом и подходом.
    P.S. Если предположить, что госпоисковик не нужен — тогда и не нужен. Но если есть государственная деятельность в электронной форме — скорее нужен.

  • Ответить
    Игорь Ашманов Сам себе компания

    И вообще, стоило бы сначала задать вопрос, что такое РФ, что такое «активы РФ», что это за право собственности — кого и на что; а также, какое отношение вы и ваши 13% имеют к этому праву.
    Только не стоит сразу фигачить камент про Конституцию, потому что а) обычно авторы таких каментов её как раз и не читали, б) если читали — не поняли, в) в Конституции про это почти ничего нет, а что есть — очень обидное и разочаровывающее.

  • Ответить
    Игорь Ашманов Сам себе компания

    Я уже писал здесь не один раз, в том числе недавно, про историю появления проекта «Спутник» в 2008 году, начавшуюся с попытки Мильнера и Усманова летом 2008 купить долю в Яндексе, похода Геры Клименко к Суркову со срезами раздачи новостного трафика новостными агрегаторами во время войны 08.08.08 и итоговой покупки КМ-Онлайн под этот проект.

    Я тогда (осенью 2008) писал «наверх» докладную записку, в которой рассматривал существующие в РФ коллективы, проекты и технологии в области поиска и делал в ней вывод, что если и покупать — то Рамблер, который в этот момент имел поисковик отличного качества, относительно недорогой и уже работающий.
    КМ-Онлайн я категорически не рекомендовал. У них поиска фактически не было, на портале KM.ru стоял Гугл.

    Про Спутник в этом обсуждении нужно понимать следующее:

    а) его пока никто не закрывает, вы читали невнимательно;

    б) новый президент Осеевский по приходу в РТ увидел в PnL проблемный актив, который жрёт деньги, вызывает репутационные потери, не показывает перспектив.

    Ровно в такой же ситуации несколько лет назад чуваки из Афиши, поставленные владельцами рулить холдингом Рамблер, поспешно уничтожили поисковик Рамблера, чтобы не нести ответственности за то, в чём они не разбирались.

    в) Так что мотивы понятны, Спутник могут и закрыть. Но могут и нет — потому что дело политическое.
    Закрыть его или хотя бы придушить в последние годы старался и предыдущий президент РТ, по тем же мотивам (убытки, непонятность, неприятие, политические проблемы). И не закрыл. Хотя и придушил.

    г) Построить коммерческий поисковик, занимающий заметную долю рынка из Спутника в данных условиях было нельзя.
    Тут где-то пишут про 20 миллионов долларов, где-то про два миллиарда рублей и т.п.
    Это совершенно негодные ресурсы.
    В Спутнике работали в лучшие годы 150-200 человек. У Яндекса только ядро пишут больше народу.
    200 человек — это 300 миллионов рублей в год. Ну 500 с офисом. Это копейки. У Яндекса $500М, больше в 60 раз.
    Там порядка 2000-2500 серверов, это вообще смешно (у Яндекса 100 000+).
    Так поисковик не сделать.

    д) Как правильно пишет Ильин (и как я писал здесь ещё несколько лет назад), из Спутника надо было делать — и по-прежнему надо делать — ответственный государственный поиск, дающий доступ к:
    1) ответственной, чистой, проверенной информации, с гарантированным качеством, отфильтрованной, без порно и грязной коммерции,
    2) к информации, к которой нет доступа у коммерческих поисковиков (государственные базы данных, госуслуги, национальная библиотека и т.п.).
    И это возможно, но не за 500 миллионов в год.

    е) Почему это не могут делать российские коммерческие поисковики? Ну потому что это не вполне российские, не вполне контролируемые компании, с коммерческими интересами и т.п.
    Они сейчас ведут себя сильно лучше, чем в 2008-2012, но недостаточно, там акционеры, антиправительственная тусовка хипстеров и т.п.
    Их тоже надо поддерживать, конечно, и ограничивать законодательно иностранные ТНК (уравнивать рыночные условия), это понятно.

  • Ответить

    В первый раз согласился с Ащманлвым, бывает же такое :). Для начала могли бы сделать нормальный поисковик по действующему законодательству а то реально фиг что найдёшь

  • Ответить

    Такой поисковик тоже уже давно есть, он называется Гарант и Консультант. И кстати, это само по себе лично для меня давно является загадкой, почему наше государство, имея в качестве одного из основных продуктов своей деятельности массив законодательства (со всеми его бесконечными патчами), не способно этот продукт выдавать сразу в виде, пригодном для повседневного использования? Вместо этого я должен платить какие-то чумачечные деньги частным конторкам, которые всё это подбирают, объединяют и удобоваримо причесывают. А тем временем правительство запиливает очередную хипстоту, в которой их продукция обрамлена красивыми жабаскриптовыми свистопердерками по последней моде, но НПА внутри них вкорячены до сих пор в виде сканов! Вот что творится в голове у тех, кто это вот так придумывает и реализует?!

    А если же кому-то нужен поисковик не по законам, а в консультационном плане (чтобы сразу выдавал какие-то намеки на решения, типа куда идти с чирьем на жопе), то это целая экспертная система должна быть. Это ж еще сложнее даже, чем просто поисковик. Она ведь должна понять, что такое жопа, что такое чирий, как он соотносится с жопой, ну выпонели…

  • Ответить

    Госсистема должна не то что «понять», она должна чётко показывать свои пределы. Коммерческий поисковик всегда изображает, что он крутой. Всегда всё понимает про всё. Из-за этого жертвы коммерческого поисковика, зачастую думают, что найденные поисковиком материалы — это подходящие материалы. Или даже «самые подходящие материалы». У коммерческих поисковиков нет даже намёка и нет видимой посетителю индикации о том, что «запрос сложный», «результаты мы можем показать только примерно, они процентов на 5% или 0,5 подходящие, но не более того».

  • Ответить

    Поскольку поисковики «знают всё про нас», и поскольку поисковиками могут пользоваться и особые персоны, в том числе из компетентных органов, в том числе и по служебной необходимости, то выходит, что поисковики знают всё и про них? Ой-ёй. Как опасно так много знать. Рекомендую Гуглу и Яндексу скинуться баблом и технологиями на наш российский гос поисковик и после этого спать спокойно.

  • Ответить

    Ну конечно, Игорь Станиславович, мы же забыли: активы РФ это личный кошелек Путина, Сечина и Ко. Наши 13% здесь действительно ни при чем.

  • Ответить
    Игорь Ашманов Сам себе компания

    Ещё раз, нищасный. Надо сначала определить, что такое РФ, какое отношение она имеет к территории и «активам», какое отношение к этому имеет народ РФ, какая модель собственности у нас вообще, кто является собственником недр, территории, госсобственности по конституции, а уж потом начать пытаться рискнуть попробовать произносить само слово «активы».
    Но надежды на системное мышление тут мало.

  • Ответить
    Владимир Мяу и компания

    Ну если системное мышление — это взять на веру кучу слов, то да, конечно. А вы попробуйте доходчивее, опишите ваше видение бюджета Ростелекома и тех, кто финансировал проект «Спутник», с помощью какого-нибудь общераспространенного языка программирования, хотя бы даже с помощью адекватного псевдокода. Уж тогда-то вы как бык аффцу покроете как минимум ту половину «владельцев рунета», которые кодят. Ну или они вас. Как повезет, короче. Верите ли вы в провидение, готовы ли вы рискнуть!

  • Ответить

    не целесообразнее ли тогда (чем тратить средства и время на уже сделанное другими в большем объеме и лучче) сосредоточится на «поиске в найденном» и применять различные фильтры, даюы придать выдаче более компактный и не размытый вид, а также «политическую» или там «антипорнографическую» составляющую?
    Вроде как поисковики на какихто там условиях свой поиск предоставляют. И если использовать их выдачу но потом фильтровать ( даже весьма жостко) — это им никакого вреда не нанесет, т.к. выдача будет заведомо более урезана (хотя возможно, что с этой точки зрения будет иметь парадоксально больший спрос защот узости и отсутствию лишнего).

  • Ответить

    >> тратить время и средства на уже сделанное другими в большем объеме и лучче
    Если принять за аксиому, что кто владеет информацией — тот владеет миром, то миром владеет тот, кто умеет ковыряться в информации. Это ковыряние не всегда сводится к простому текстовому поиску, знанием которого сильно гордится Ашманов. Поэтому и результаты чужой поисковой деятельности фильтровать можно, но не очень интересно.

  • Ответить

    >>И если использовать их выдачу, но потом фильтровать

    Можно и по-другому. Во-первых, был такой очень симпатичный проект флексум, который заранее «фильтровал» область поиска с помощью некого (неких) экспертов (проект приказал долго жи… искать).
    Можно и по-другому. Не знаю как конкретно работает поиск, но могу предположить в порядке бреда, что:
    а) сначала «индексируется» (считывается, анализируется и помечается) информация «в тырнете». При этом значимая её часть копируется на спец сервера. Наверное, это самая затратная часть со всех точек зрения (бабло, ПО, железо, людишки-программишки, печенюжки, электричество).
    б) Поисковый запрос тоже «индексируется».
    ж) Потом идёт подбор информации в выдачу с точки зрения соответствия этих индексов (информации и запроса)… эээ (?) и других сторонних критериев (корректировочки по тем или иным мотивам).
    И что? А вот:
    Яндекс мог бы (не хочет — заставим) предоставлять (продавать) результаты своей бурной деятельности по отдельным пунктам: а) или а) + б). Тогда осталось бы реализовать свои пункты б) + ж) или только ж). По пункту а) мог бы, даже, пустить (за дэньги) на свои сервера со скопированной информацией, чтобы её перелопачивать («ковыряться») другими альтернативными алгоритмами (или уже кой-кого пускает?!). Как-то так.
    Сейчас придэ один известный ник и спросит — а знает ли кто тут как произносится по аглицки «Data Mining» . За себя говорю сразу — понятия не имею и знать не хочу. И буду считать такой вопрос флудом.

  • Ответить
    Игорь Ашманов Сам себе компания

    «Простой текстовый поиск» — это зачотная, угарная идиома.
    Как раз вчера у Коваленко цитировалась дискуссия с таким угоревшим:

    https://www.facebook.com/andrew.kovalenko.3/posts/1302860163162130?pnref=story
    — Мы сейчас поиск такой забубеним, полнотекстовый, с пониманием сути текста!
    — Сути текста?
    — Да! Морфологический анализатор у нас уже есть, сейчас вот прикрутим синтаксический от АОТ, останется только семантику…
    — Семантику?
    — Ну да! Там же главное — чтобы машина понимала, о чём её спрашивают, и сопоставляла тексты документов с сутью вопроса!
    — Сопоставляла тексты? Это вы так ранжирование называете?
    — Да, сопоставляла тексты. А ранжирование — это бред, который придумали в Гугле, а Яндекс скопировал. На самом деле никакого ранжирования не надо, ответом на вопрос у нас будет единственный документ!
    — Удачи вам, ребята! :) :)

    Флексум не с экспертами работал, а как раз давал возможность построить свой поисковик в своей предметной области, эксперт ты или просто собираешь тусовку вокруг темы. То есть экспертами выступали пользователи, поставившие себе поисковик.
    Можно было задать список сайтов, глубину обхода, частоту обхода и многое другое, встроить к себе на сайт или в базу данных.

    Там было сделано около 12 000 поисковиков, самые большие — на несколько десятков тысяч сайтов. База общая была на многие терабайты. Поиск имел всякие фишки, в том числе дайджесты заданной темы вместо ранжированного списка.
    Но мы так и не смогли его монетизировать или найти большие партнёрства.
    Им руководил Андрей Калинин, он сейчас — начальник поиска и браузера в Мыле.

    Яндекс несколько раз давал возможность ставить свою поисковую строку, отчуждаемый поисковик, брать фид и фильтровать результаты — и каждый раз закрывал её.

  • Ответить

    > сосредоточится на «поиске в найденном» и применять различные фильтры, дабы придать выдаче более компактный и не размытый вид, а также «политическую» или там «антипорнографическую» составляющую?
    Вроде как поисковики на каких-то там условиях свой поиск предоставляют.

    На самом деле нет. Кончилось это время. Именно потому, что информация — это на сайтах, а большие пользовательские данные — в запросах пользователей. Кто стоит фронтом к рынку — тот и собирает весь мёд.

    В принципе, получить фид Яндекса можно — например, на Рамблере стоит поиск от Яндекса. К которому они прикручивают разные фишки.
    Но это каждый раз отдельный проект, с долгими переговорами, за серьёзные деньги.
    И ты зависишь от того, какие сайты и с какой скоростью выкачает Яндекс. Заставить его индивидуально и сейчас выкачать что-то, что нужно тебе — уже нереально. Приходиться полагаться на гипотезу, что он делает всё возможное, со всей возможной скоростью и нейтрально.
    Что в общем случае неверно, у него есть свои коммерческие интересы, даже если политически он нейтрален.

  • Ответить
    Альтер Эго

    У Google тоже есть возможность создавать собственный поиск. Можно включать сайты или отдельные страницы. Скоро его закроют наверное — проект старый, но не особенно известный.

  • Ответить
    Игорь Ашманов Сам себе компания

    Вы почитайте условия предоставления.

    Я читал договора на установку Гугла на порталы Рунета (Мыло и другие).
    Там совершенно жёсткие условия по выдаче.
    Ни фильтровать, ни менять порядок ссылок в выдаче — нельзя.

  • Ответить

    собственный полнотекстовый поиск по интересующим ресурсам, если абстрагироваться от вычислительной мощности, вроде не особая проблема. люцена, например.

  • Ответить

    понятно, что вопрос использования ресурсов стороннего поиска лежит, в большей степени, в юридической и маркетинговой плоскости, нежели в технической. Но, безусловно, какимто образом это реализуемо.
    Разумеется, простой перенос чужих результатов, да еще с их цензурированием или собственным ранжированием неприемлем ни для какого поисковика.
    Это как если брать, допустим, тушонку какогонить завода, переклеивать этикетку и продавать под своим брендом. С одной стороны, заводу обидно, бренд, бла бла и прочее. С другой — если покупают оптом то и фигбы с ним.
    Но если вы открываете сеть фастфудов по продаже картошки с тушонкой — то очередь тушоночников будет к вам в поставщики стоять длинная.
    Т.е. дело, в большей степени, в постановке задачи и прочих процедурах.
    Например, если вы замутили какойто квазипоисковик выдающий этакий винигрет из данных сразу нескольких поисковых систем.
    Или, допустим, выдача как выдача не выдается пользователю, а сперва скрипт запрашивает поисковики (это незапрещено) но не показывает ее , но после сам лезет на все эти сайты и уже какбэ сам проводит их индексацию и оценку по своим критериям..
    Кстати, уже бы пора от списочно-страничного формата комуто переходить на графическое и колористическое отображение результатов поиска. В виде какогото там, допустим, цветика-семицветика иили прочей диаграммы, штобы както было наглядно и очевидно, что отсортировано и по содержанию и по концентрации политпорнографичности там всякой.

  • Ответить

    собственный полнотекстовый поиск по интересующим ресурсам, если абстрагироваться от вычислительной мощности, вроде не особая проблема. люцена, например.

    Это так кажется.
    По собственному корпусу текстов/документов — да, не проблема. По Интранету — тоже.
    Хотя с ранжированием и лингвистикой там будет плохо.

    А вот с выкачиванием сайтов из реального Интернета — хорошо не получится.
    «Поиск по грязному Вебу», как говорил Сегалович — это отдельная проблема, люценам и сфинксам в целом неизвестная.

    Ну и абстрагироваться от вычислительной мощности с поисковиком никогда не получается. Это основная проблема, если абстрагироваться от качества поиска.

  • Ответить

    Но если вы открываете сеть фастфудов по продаже картошки с тушонкой — то очередь тушоночников будет к вам в поставщики стоять длинная.

    Только в случае большой аудитории, уже имеющейся в сети.
    Или большой предоплаты поставщикам.

  • Ответить

    Например, если вы замутили какойто квазипоисковик выдающий этакий винигрет из данных сразу нескольких поисковых систем.

    Таких попыток сделать метапоиск было несколько волн с 1996 года. Все — провальные. Последние — Блекко, Нигма, Квинтура.

    Я тоже поучаствовал, у нас в 1997-1999 был поисковик Следопыт, объединявший Альтависту, ХотБот, Рамблер, Яндекс, Апорт. Составлявший серию (конъюнктивно-дизъюнктивную форму) запросов вместо изначального запроса, объединявший и заново ранжировавший результаты и даже переводивший запросы с русского на английский и обратно. Схема не работает.

  • Ответить

    Кстати, уже бы пора от списочно-страничного формата комуто переходить на графическое и колористическое отображение результатов поиска. В виде какогото там, допустим, цветика-семицветика

    Тоже пробовали много раз. Резко ухудшает UX, вызывает отток пользователей.

    Сейчас вид выдачи тестируют на когортах и А/В-тестах относительно сдвига строки поиска или блока рекламы на несколько пикселей. Так что там всё известно про «инновации в подаче».

    Даже попытки объединять результаты, сделать иерархию, рубрики, смысловые кластеры — не работают.
    Это как с левосторонним движением: нельзя на правую сторону переходить только машинам с чётными номерами.

  • Ответить

    >> Тоже пробовали много раз.
    >> Даже попытки объединять результаты, сделать иерархию, рубрики, смысловые кластеры — не работают.

    Честно говоря, пишу на ходу что в голову взбредет. Не удивляюсь, что это все уже перебрали те, кто именно поисковиками занимается.
    Хотя, та же гугловская поиск по патентам базы патентого ведомства — оч. удобен и нагляден.
    Так или иначе, уберизация поиска какимто образом произойдет — вопрос каким и зачем? Монстры создавшие инфраструктуру (будь то операторы связи или такомоторные перевозки) обязательно породят кучу оптимизаторов и паразитов, от сскайпов до всяких там мессенджеров и прочее.
    Но тма понятно — экономия денег тупо движет. А вот в поиске что должно двигать? Выдача-то бесплатная.
    Политизация, огосударствление или антипорнографизация тут слабый стимул. И идет не в русло «найдена инфа», а в прямопротивоположную сторону «чорное\белое неговорить» и вообще овальный, овал, аваль, навал, двенадцатый ваал — не выдавать какбудто нету таких слов. Это непродуктивно и, поэтому, обречено.
    Вот чего я бы хотел от поиска? Гугл тот же в целом удовлетворяет запросам. Конечно, хотелось бы еще более точного поиска и меньше шелухи.

    Чтоже касается конкретного спутника — надо вспомнить само происхождение слова и дальнейшее существование. Кажеца Достоевский выдумал. Потом Королев и иже с ним присвоили прибору такое имя. И один и другие — были, некоторым образом, глыбы (в профессиональном и личном плане).
    А тут мы наблюдали постмодернизм, когда взяли словцо и под него начали сооружать госполитпроект. Пробковые подмышники «любовь пчел трудовых» и подтяжки «ответ чемберлену». Яндекс — тот хоть неологизм выдумал.

  • Ответить

    >> Ну и абстрагироваться от вычислительной мощности с поисковиком никогда не получается. Это основная проблема, если абстрагироваться от качества поиска.

    Ну, абстрагироваться можно, если предложить оригинальный механизм индексации. Тогда обеспечение вычислительной мощности — проблема того, кто будет с этим играться. Может, тот угоревший из цитаты не так уж неправ?

  • Ответить
    Игорь Ашманов Сам себе компания

    Оригинальный механизм индексации, конечно, объясняет всё.

    Но тем не менее, Яндекс и Гугл постоянно держат от 4 до 6 копий всего Интернета, просто в силу бизнес-процесса.

    Сначала надо обойти весь Интернет и выкачать сырые ХТМЛи, потом их нужно превратить в обратный полнотекстовый индекс, при этом сохранить так называемый «кэш», то есть прямой индекс, для показа сниппетов и полных образов страниц и т.п.

    И вот если будет прямо совсем гениальный механизм индексации, который хранит только «смысл», из этих пяти копий удастся сэкономить парочку. С остальными тремя что делать?
    Ну и с выкачкой всего Интернета на первой стадии — что делать? Не выкачивать?

  • Ответить

    Спутник лишний раз подтверждает мое глубокое убеждение что государство должно постепенно уходить из экономики, заниматься инфраструктурой, правилами игры и защиты своих дойных коров частных компаний от несправедливой конкуренции.

    И не потому что государство всегда будет ресурсы в бизнесе тратить менее эффективно чем частник, иногда кстати это и не так, а потому что любой провал со стороны государства или компании с гос. участием будет бить по политической системе в общем, типа очередной распил бюджета, хотя без провалов и вообще проб и ошибок бизнес не может существовать, всегда нужно идти на риск и всегда будут крахи, примерно 7-8 проектов умрут из 10 и все эти крахи не должны бить по государству, все экономические крахи должны приходиться на частный бизнес, по крайней мере должна быть такая иллюзия.

    Стабильности политической системе ничто не должно угрожать, в этом заинтересован и весь бизнес в том числе, не возможно развивать долгосрочные проект без политической стабильности, а все не чисто спекулятивные бизнес проекты долгосрочные.

    Считаю инициативу развития непрофильных направлений всех гос. компаний и естественных монополий нужно серьезно ограничить, чтоб попытка тому же Ростелекому без одобрения федерального правительства сделать очередной «спутник» расценивалась как нецелевое расходование бюджетных средств и не меньше и не больше.

  • Ответить

    >>То есть один будет подбрасывать гениальные идеи, а другой оплачивать сервера?
    Ну так-то можно, если лоха найти.

    «Другой» итак уже оплачивает сервера. В сотовой связи появились же MVNO, (mobile virtual network operator — оператор сотовой связи, использующий существующую инфраструктуру другого оператора, но продающий услуги под собственной маркой). Может быть, что-то аналогичное замутить можно и в поиске.

    >>Флексум не с экспертами работал, а как раз давал возможность построить свой поисковик в своей предметной области, эксперт ты или просто собираешь тусовку вокруг темы. То есть экспертами выступали пользователи, поставившие себе поисковик….

    Да, знаю, я пробовал его использовать. Интересно было. Такое ощущение, что чуточку чего-то не хватило. Может быть — именно экспертов) Жаль проект.
    P.S. эксперт — это конечно слово ругательное уже.

    >>Но мы так и не смогли его монетизировать или найти большие партнёрства.

    Может быть, подумать о реинкарнации проекта? В частности, поиск по сайтам отобранным именно экспертами в своей области мог бы быть интересен пользователям.
    Когда ищешь что-то вроде расписания движения автобусов из города А в горд Б, то выдача большая, но не достоверная. То же самое — по законодательству и т.п.
    Или вот сейчас набрал курьёзити и выдало кучу хлама, про то, что курьёзити по земле ездит, а не по Марсу.
    И для гос пользования тоже можно было бы как-то использовать.
    Может быть, открыть тут (или не тут) отдельную тему по флексуму и подолбить мозговым штурмом на предмет развития идеи?

  • Ответить

    >оператор сотовой связи, использующий существующую инфраструктуру другого оператора,
    Странно конечно что Яндекс или Рамблер не подключили в качестве мула для спутника, они бы правда могли бы выступить в роли физического оператора для «виртуального», им бы можно было бы не деньгами оплачивать услуги а допуском их ботов к гос. информации и административным продвижением подсобить, думаю было бы полезно чтоб молодежь к Яндекс к примеру привыкала еще со школ и институтов а не к гуглу как сейчас.

  • Ответить

    Никаких проблем с подключением коммерческих поисковиков к государственным базам данных нет, сотрудничеству несколько лет (правда есть не проблемы, но условия — персональные данные обезличиваются, при монетизации нельзя ставить в рекламу: колдунов, продавцов БАДов и прочих уродов и так далее).

    Про Яндекс.Пробки все помнят, подзабылось другое. Напомню. В сентябре 2014 года свои данные «Яндексу» открыли власти Москвы: компания получила доступ к трекам движения, информации из системы оплаты парковки, к записи на госуслуги для Яндекс.Города; Яндекс.Деньги интегрировали со столичными платежами. Затем IT-департамент Москвы начал сотрудничество с Rambler&Co: «Авторамблер» объединили с разделом госуслуг для водителей, Letidor.ru — с системой записи в школы, Рамблер.Недвижимость подключили к БТИ. В том же марте 2015 года «Яндекс», Mail.ru (и ещё 2 десятка! компаний) пустили к электронным медкартам москвичей. В июне 2015 года соглашение с «Яндексом» подписало Министерство информатизации и связи Татарстана. Поисковик связали со «школьными картам», лечебными учреждениями, расписанием транспорта, системами оплаты парковки в республике. В сентябре 2015 года Никита Белых (то есть и не Собянин, а вообще «оппозиционер» тоже может подключать) позвал «Спутник» (!), Rambler.ru и «Яндекс» информационно прокачать Кировскую область и они откликнулись и пришли.

  • Ответить

    По вашему комментарию я еще больше согласен с Клименко что Спутник мертворожденное дитя, мало того что бюджет на него выделили смешной для поисковиков, так еще и эксклюзива на доступ к гос. данным не предоставили.

    Так что гос. компаниям нужно серьезно ограничить их бизнес эксперименты, а то как то это все дурно пахнет.

    Но на мой взгляд не хватает административной поддержки Яндексу и Рамблеру, чтоб у них был какой то спец поиск без чернули для школ и институтов.

    Но тут уже вспоминается Ашманов насчет антиправительственной тусовки в этих поисковиках, которые скорее всего будут саботировать партнерство с государством.
    В подтверждению этого у нас тут даже на нашем родном роеме есть один такой из «антиправительственной тусовки», главный аналитик Петровский из Рамблера (подразделение бегун + прайс.ру) помнится такие строки писал:
    «Они ядерными боеголовками не машут, радиоактивный пепел не разбрасывают, Сирию не утужат на деньги пенсионеров и больных.
    Дайте, дайте Царя»
    или
    «Страна для меня — народ.
    А не чиновники и не функционеры.»
    https://roem.ru/22-11-2016/236928/no-nds-please/#comment-243136

    И вот как государству с компаниями имеющими таких сотрудников можно какие то партнерские истории с строить?
    Замкнутый круг, государству нужен заточенный под спец задачи поисковик, само оно его не осилит, а поисковики которые вроде как российские и которые могут это сделать, внутри по факту не сильно лучше супастатов всяких, задача….

  • Ответить

    На мой вкус Петровский — патриот. И, как свойственно для многих патриотов консервативных взглядов, он не считает чиновников самостоятельной ценностью. Но это, на самом деле, не важно вообще никак, так как никакого Петровского в глазах государства нет (что не мешает государству содержать в доме, построенном его предками, «музей» «Ленина»). На каждого Петровского есть Мамут. Через которого прошла Евросеть, проведут (проводят) московские кинотеатры и столичный урбанизм. Государственный портрет «Рамблера» — это совокупная «Афиша» (где руководитель одной рукой берёт у Собянина деньги, а другой рукой берёт у Собянина «интервью»), а не Петровский. Мамут — надёжный, подтверждённый партнёр в глазах государства.

  • Ответить

    >На каждого Петровского есть Мамут
    А у сбербанка есть золотая акция Яндекса, тогда повисает вопрос в воздухе, а что это такое было, этот спутник ?
    Зачем то же государство попыталось сделать этот выверт с переворотом, не может же быть такого что просто попилили бюджет нерадивые чиновники (в гос. компании считаю все сотрудники по факту чиновники), нет же смысла именно так это делать, пилят всегда в более тихих местах чем в таких громких как новый отечественный поисковик, который будут с лупой все разглядывать…
    Вариант что большие дяди думали что вот так с кондочка сделают по быстрому новый яндекс за шапку сухарей слабо себе представляю, хотя конечно и на старуху бывает проруха.
    Что то мы не понимаем в этом кино, хочется понять….

  • Ответить

    >Петровский — патриот. И, как свойственно для многих патриотов консервативных взглядов, он не считает чиновников самостоятельной ценностью.
    Офтоп конечно, но что то власовцы мне вспомнились, те тоже были патриоты но против чиновников-большевиков, даже не знают кто лучше для России был верхмахт или такие «патриоты».

  • Ответить

    >>На мой вкус … — патриот.

    Иван, патриота нужно не на вкус, а на зуб пробовать)

    >>Что то мы не понимаем в этом кино, хочется понять….

    Очень простую вещь «мы не понимаем» — что это «кино не для всех»)

  • Ответить

    >что это «кино не для всех»)
    Это то скорее всего да, но очень хочется его посмотреть, хоть одним глазом…
    Но по факту все дело в наши мозги упирается, потому как чтоб смоделировать недостающие фрагменты мазайки нужно мозга даже больше чем у тех кто наверху ее составлял или имеет больше элементов, но раз они на верху а мы внизу то мозга у них точно не меньше нашего, по факту больше конечно, но у нас тут коллективный разум же, может и «домодулируем» чего.

  • Ответить

    Что-то не совсем понятно про запрет фильтрации выдачи поисковиков. Как тогда DuckDuckGo работает? Кстати кто нибудь в курсе сколько в него залили и какая у него доля по сравнению со спутником?