Скончался Михаил Донской

Развитие событий: Погиб Евгений Додонов, бывший разработчик Mandriva (10 июля 2012)

Сегодня, неожиданно для всех, ушел из жизни Михаил Донской (на фото), владелец небольшой IT-компании "Диско".

В отечественном программировании Михаил, ученик известного математика Георгия Адельсона-Вельского, был личностью легендарной. Он занимался проблемами искусственного интеллекта, разработал шахматную программу "Каисса", ставшую первым чемпионом среди шахматных программ, Михаил один из основателей компании "ПараГраф".

Им созданы "Лексикон" для Windows, самая популярная в СССР СУБД для больших машин "ИНЭС", а современным пользователям больше знакомы его продукты, разработанные в компании "Диско": "Диско-Качалка", "Диско-Командир" и другие. Также его компания разрабатывала на заказ приложения для мобильных телефонов и наладонников, в частности мобильные клиенты для Lingvo и 1С.

Донской был автором множества статей на темы ИИ и программирования.

Михаилу Донскому было 60 лет. В августе прошлого года по случаю шестидесятилетия он опубликовал очень интересную статью о своем опыте программирования.

Редакция Roem.ru приносит соболезнования родным, друзьям и коллегам покойного.

Добавить 181 комментарий

  • Ответить

    Также добавивший информацию о смерти Михаила приписал: «Это был чрезвычайно умный и достойный человек. Все, кто его знал, наслаждались общением с ним и очень ценили его жизненный опыт и мудрость. Господи, упокой его душу»

  • Ответить
    Игорь Ашманов Сам себе компания

    Он ещё, кстати, был многократный чемпион СССР по бриджу и вообще по жизни игрок. Он также консультировал казино по вопросам безопасности и анализа сговоров, а также писал софт для игровых автоматов.

  • Ответить

    Я тоже наслаждался общением с Михаилом Донским в девяностых, меньше чем Ашманов, но все же. И почти всё про заслуги уже сказали, кроме того что Донской был еще и колумнистом PC Week /RE (и однажды — «Компьютерры»). И еще — консультантом по интерфейсам, дешевле 50 долларов не давал советов даже своими приятелям. Но а то как он консультировал казино по вопросам безопасности оценить может только тот, кто слышал Михаила Донского. Последний раз я видел его «Думе» на клубе «Интернет-бизнес».

  • Ответить

    «Программист живет в среднем столько же, сколько и нормальный человек, а вот его проекты… Рембрандт написал «Ночной дозор», и на него до сих пор все смотрят. А что у программиста? Машины меняются как в калейдоскопе, операционные системы приходят и уходят, СУБД тоже. Выясняется, что наш труд остается все больше в воспоминаниях. «Каисса» по нынешним временам – смешная шахматная программа. ИНЭС с Oracle не сравнишь. Мы – расходный материал. Мы можем оставить после себя только опыт и знания, но не продукты. Какими бы классными они ни были. У журналиста, между прочим, тоже – где ваши вчерашние статьи? Смешное противоречие: ты работаешь на корзину, даже если ты производишь лучший софт в мире». Из интервью Михаила Донсокго Андрею Анненкову Поэтому очень важны его статьи, к примеру такая, которая не вошла в собрание статей на IT-блоге. А началось всё с того, что послушав в очередной раз Донского редактор PC Magazine Рубен Герр заметил, что если ты так говоришь, то значит ты сможешь и писать. И точно оказалось, спасибо Герру за наблюдение, хотя Донской писал главным образом не в его журнале. А программы… Скажем, толстые клиенты Донского у меня были все, все легальные, кроме качалки, но пользовался я только Наблюдателем (мало). Зато в Диско Коммандере просидел всё время своей жизни, прошедшее под Windows 95/98. При передаче данных по FTP Диско-Коммандер налету перекодировал записи, которые хранились на моем компьютере в кодировку KOI-8, в которой лежал мой сайт на Чертовых Куличках. Мелочь? Ни в одной другой файловой оболочке, включая FAR, я такого не видел. А программ у него было очень много, причем зачастую к некоторым программам он писал только интерфейсы. С OCR, помнится, он работал, но уже не помню как… Зато помню его формулу, которую использую в работе до сих пор: Написание [некий вид модуля] не является для программиста творческой задачей.

  • Ответить

    Послушать его голос в интервью: Где взять и откуда берутся программисты в России? Михаил Донской на Радио Свобода http://itblogs.ru/podcast/Svoboda-Kostinsky-Donskoi.mp3 Беседы о программировании с Михаилом Донским http://itblogs.ru/podcast/Donskoy_30072.mp3 Как грустно. Я обещал ему помочь с устройством серии его лекций по программированию — у него был настолько не совпадающая с официальным курсом точка зрения, что ни один ВУЗ не был готов к этому. И затянул… и вот на днях собрался звонить ему… нельзя откладывать ничего в этой жизни ((

  • Ответить
    Игорь Ашманов Сам себе компания

    Мы с ним собирались устроить семинар по искусству программирования, алгоритмам и прочему у нас в ЦЭМИ, уже договорились о местном зале. Он ещё в декабре меня спрашивал, как там, будем ли делать.

  • Ответить

    Очень жаль. Мне приходилось работать с ним в конце 90-х — человек потрясающей энергии, с которым приятно оказаться в одном проекте. За последние десять лет это один из самых интересных людей, с которыми приходилось встречаться по работе. Это несомненно потеря для всей отрасли :(

  • Ответить

    Юра, ты ошибся: Ботвинник никакого отношения к Каиссе не имеет. Он был знаком с Донским, но не работал с ним ни над Пионером, ни тем более над Каиссой. То, что ты написал, оскорбляет память обоих. Это тем более досадно, что вслед за тобой эту ошибку тиражировал синьюз http://www.cnews.ru/news/line/index.shtml?2009/01/14/334306 — без ссылки на источник, разумеется. И пошло гулять по Сети (( Анненков

  • Ответить

    Да, прости Андрей. Я исправлю, и стукну Cnews, попрошу чтобы исправили. Думаю, что Донскому и Ботвиннику память оскорбить сложно, разве что я свою небрежность показал, но это не так существенно.

  • Ответить

    Юра, ну что ты у меня прощения просишь. Я-то тут при чем… Существенно это, увы. Это все равно как если бы тебе в соавторы твоего проекта достойного, но непричастного человека записали. Исправлять поздно. Хотелось бы знать имя автора разве что

  • Ответить

    Господа, в частности, Анненков и Синодов: Я хорошо знаю Влада Арлазарова, одного из основных людей Каиссы. Насколько я смутно помню разговор с Владом в 1994 году, Ботвинник имел отношение к Каиссе, но довольно специфическое: Ботвинник подтвердил ЦК КПСС, что Арлазаров и Донской — правильные ребята, и что им можно доверить написать программу, которая впоследствие выиграла мировой чемпионат шахматных программ в Канаде. И еще. Вы написал, что Донской — автор «Лексикона» для Windows. Я этого не знал. Автор «Лексикона» для DOS — Веселов. Вы имеете в виду, что Донской написал текстовые редактор для Windows с таким же названием, как и Веселов — для DOS?

  • Ответить

    Компания Арсеналъ купила у Микроинформа все права и исходники Лексикона для ДОС и недоделанного для Windows, ДИСКо была подрядчиком у Арсенала при разработке с нуля версии для Windows, поскольку код Веселова был в результате выброшен.

  • Ответить

    Сейчас профессия осталась, но, как и профессия шофера, она не требует творчества и особых знаний, а только определенных навыков. Программирование из искусства становится ремеслом, и я счастлив, что всю жизнь занимался программированием, пока это было так же интересно и почетно, как пилотировать самолеты во времена А. Экзюпери. Эх, блин заклеймил. Что же нам, простым людям-то делать? В ынтырпрынеры податься?

  • Ответить
    Альтер Эго

    2itman Это достаточно стандартное мнение для старых художников. Любая творческая и массовая професссия состоит из художников и ремесленников. Это относится к поварскому искусству, есть шефы, а есть ремесленники массового изготовления фастфуда, к дизайнерству (от мебели и одежды до веб сайтов), есть дизайнеры, создаюшие новые направления и революции, а есть ремесленники, комерчески употребляющие, усвоенные на курсах несколько приемов. После того как профессия становится популярной, число художников становится относительно меньшим, а ремесленников относительно большим. Люди, начинавшие в самом начале и творившие могут видеть не замечать новые направления и новых гениальных художников (это относится к программированию с таким же успехом как и к джазу или строительству мостов). В этмо кстати разница между гениальностью и талантом. Гений знает все новые направления развития области и ему в голову не придет говорить, что «были люди в наше время». К примеру, ни Стоунбрекер, ни Дж Грей никогда не жаловались, что ничего интересно в базах данных нынче нет, «а вот в наше время», потому, то они прекрасно знали, что происходит, и что много интересных работ делается сейчас, не менее значимых, чем в данное время. WARNING: All messages posted under this profile are actually algorithmicly generated by an AI computer program. No truth or actual events are being generated, and as a result cannot be investigated for thier validity. (message 74822)

  • Ответить

    Но романтический и постромантические периоды у индустрий двадцатого века, всё равно — налицо. Звукозапись, фотография, радио и телефон, продукты питания быстрого приготовления, путешествия, энергетика, стоматология. Джаз опять же.

  • Ответить

    Насколько я знаю, Ботвинник у арлазаровцев консультировался по математике, у него были свои идеи (каких результатов он достиг я не знаю, врядли серьезных). Плюс Ботвинник был знаковой фигурой и очень хорош как авторитетный эксперт для советского государства (тут про это написали)… —- А касательно программирования — по мне, там присутствует три составляющих, а не две, — ремесло, наука и искусство. Сейчас две последние составляющие отошли на второй план. И окончательный перелом произошел скорее не в 80’ые, а в начале 90’ых, с началом доминирования Windows с ее окошками и т.п., программирование стало индустриальным/конвеерным (привет индусам и ко со специализацией по кускам интерфейсов). Еще одна проблемма в том что технологии слишком быстро меняются, Донской хорошо написал про C/C++, ничего и не добавишь.

  • Ответить

    Привет не индусам. Привет тем, кто понял, что оптимизировать нужно внутренний цикл — самый часто повторяющийся. В данном случае оптимизировать нужно сам процесс создания — распространения программ. И оказалось, что проще вложиться в железо — самый «внутренний цикл», а уж программирование сделать доступным для всех идиотов — лишь бы работало, а уж производительность будет достигнута за счет железа. Ну и введя оконный интерфейс стало возможным подключить к разработке массы. Программ стало много… Кстати, Донскому бы больше понравилась дискуссия о путях развития индустрии, чем соболезнования )

  • Ответить

    так я же и написал про индустриальную/конвеерную разработку… что индусы тут вторичны естественно понятно, первичен тот кто смог их встроить в процесс… и кому конкретно передавать привет тоже более/менее понятно а куда все развивается понятно, смотри на google (все уходит в броузер/online)

  • Ответить
    Альтер Эго

    Послушайте, ну сколько уже можно! Строите из себя знатока, а пишете «броузер»! Слово browse произносится по-английски как брауз, а слово browser как браузер.

  • Ответить

    «Кстати, Донскому бы больше понравилась дискуссия о путях развития индустрии, чем соболезнования» Это здесь ему бы понравилась дискуссия о путях развития индустрии (еще в девяностых у него вышла статья, примерно называвшаяся «Для кого мы создаем программный рынок?»). А вот ему теперь нужны ни дискуссии, ни соболезнования, а именно добрые слова (см. учение о посмертных мытарствах).

  • Ответить

    А что поменялось-то? Шахматные программы по-прежнему развиваются (Rybka, Deep Fritz, Schredder). Регулярно проводятся чемпионаты шахматных программ. А из российских недавних успехов — программа нашего соотечественника Сергея Маркова Smarthink (чемпион России и СНГ 2005 года) одно время входила в десятку лучших. http://en.wikipedia.org/wiki/SmarThink Извините, не по теме немного. Но кто мешает-то «искусством» заниматься? Раньше, как тут отметили, чуть ли не согласие КПСС требовалось. А нынче — масса возможностей. Много разработок. Среди тех же шахматных программ.

  • Ответить

    Осилил много почитать по теме. Человек, конечно же, с массой достижений, спору нет, потеря. Может грубовато выскажусь, но слышны у него в суждениях нотки из мультика про Масяню: «А вот я-то в советские времена! О!». Из конструктивного: остался в прошлом, живёт прошлым, впрочем как и все виндузятники. Не видит простых вещей, например, беспрекословного соблюдения правил безопасности. Почему так произошло и что помешало ему стать российским Столманом или Торвальдсом? На мой взгляд, он стал русским Билл Гейтсом.

  • Ответить
    Игорь Ашманов Сам себе компания

    Пианисту: Уважаемый. Вы, по-моему, не понимаете смысла слов, которые пишете. Мише в прошлом году стукнуло 60 лет. Это тот предел, за которым у большинства мужчин уже нет новых достижений, они остаются в прошлом. А некоторые вообще умирают — вот как Миша умер. Посмотрим на вас, когда вам стукнет 60 — на что вы будете способны. И что у вас будет на стол положить из прошлых достижений. Теперь и Миша остался в прошлом для нас. Но это наше героическое прошлое. Адельсон-Вельский, Кронрод, Донской — это как былинные богатыри, которые придумали многие важные вещи в математике и в кибернетике раньше, чем на Западе и были вровень с самыми крупными фигурами оттуда. Миша не был виндузятником или юниксоидом. Как он писал, «написание «модуля» не является творческой работой». Творчество в информатике начинается раньше программирования и раньше любых ОС. Он был учёным, математиком и большим специалистом по программированию вообще и алгоритмам ИИ. Таких в нашей стране почти не осталось — и больше по сути не делают, поклоняясь языческому идолу реюзабельного кода в зарослях окошек, кнопок и всяких пхп. Об этом Миша и написал в своей юбилейной лекции. Сравнивать его с Гейтсом или Столманном бессмысленно. И никто здесь не сравнивает, кроме вас. Как говорил Солон Крезу, говорить, прожил ли смертный счастливую и успешную жизнь можно, только когда он уже умер. А когда человек умирает, становится ясно, что успех нельзя мерить количеством денег, размерами аудитории и даже величием свершений. Успешная жизнь — это что-то другое. Я с Мишей общался много, хотя и сильно меньше, чем стоило бы. И теперь жалею, что о многом не спросил его, как это обычно бывает, ведь он казался вечным. Я сейчас вижу, что он прожил счастливую и успешную жизнь, и я ему искренне завидую. Он был искренним, открытым, чрезвычайно светлым человеком, который никого не обманывал, не тянул одеяло на себя, а просто делал всякие интересные вещи, много думал и делился мудростью с окружающими. У него было множество друзей. Мне и многим другим он сильно помог в понимании мира. Добавить сюда троих умных и успешных сыновей — что ещё нужно для счастливой и успешной жизни? Помяни, Господи, его душу во царствии твоем.

  • Ответить

    Доброй памяти Михаилу. Мне повезло столкнуться с ним много лет назад. Он сразу удивил меня парадоксальностью мышления. Он был одним из тех редких людей, общение с которыми каждый раз приносит что-то ценное — радость, знание, новую мысль. Моя компания, ABBYY, имела возможность поработать с Диско, и я очень рада этому. Доброй ему памяти. Было бы здорово, если бы таких интересных людей, как он, было больше.

  • Ответить

    Никто не отрицает ни чьих достижений. Речь всего лишь идёт о том, что интонации «а вот я-то в советские времена!» всегда смотрятся плохо. Взять к примеру такие слова: «Сейчас профессия осталась, но, как и профессия шофера, она не требует творчества и особых знаний, а только определенных навыков.» Это неправда и правда. Правда в том, что сейчас действительно есть спрос на быдлокодинг, дешевый, тупой. Ну и что? 150 лет назад был спрос на быдломатематикинг — кассир, например. И что, с изобретением механической кассы ведь тоже можно сказать: «вот раньше-то 370 грамм от стоимости килограмма, да как в уме-то считали. А сейчас? Сидят кнопки жмут!» Неправда в том, что как раз пространства для творчества стало больше. И ассемблерные коды никуда не делись, ещё только впереди кружки школьников и студентов, изготавливающих простых роботов: от написания прошивок к холодильнику, до небольшого робота по бурению Марса. Задач, в том числе алгоритмических, сотни. О человеческих достоинствах я вообще не говорил, но мне кажется делать заявление о том что «таких не осталось» — слишком пафосно и надуто. Есть. Сысоев, например. Да и не правильно сравнивать успешность жизни с успехов в профессии. Тот же Тьюринг вообще свёл счёты с жизнью из-за ахтунга, что вообще лучше не упоминать, а почаще вспоминать его достижения в области теоретической информатики.

  • Ответить

    1. Когда Миша изображал Ноя Советского Программирования, он, конечно, играл. Ну, один склонен к шуткам, другой – к звериной серьезности. Миша предпочитал, шутки, замечу, беззлобные и никому не идущие в ущерб. И хотя (т.е. потому что) наставлением Ботвинника и Папы Римского он не пробавлялся, человек он был светлый и легкий ( ~ Жил певчий дрозд), а вовсе не важно-шествующе-фундаментальнозадый распорядитель от науки или чего еще. 2. И справка, навеянная рядом Игоревым рядом: (Ландис)-Адельсон-Кронрод-Донской. А то как-то слишком грустно. Г.М.Адельсон-Вельский вполне успешно отметил 85-летие — кажется, в прошлом году (что странно, специально посмотрел год рождения. Гэма).

  • Ответить

    Кстати, Арлазаров, Кронрод, Дыник и Фараджев фигурируют в западной литературе под кодовым названием four-russians approach :-) Они тогда действительно много сделали в области CS. Так что я здорово завидую Михаилу, что ему довелось учиться у таких людей. :-)

  • Ответить

    Я дико извиняюсь, их имена в отличие от Михаила только по латинской транскрипции знаю. В интервью, действительно, была правильная версия фамилии, но на момент написания она у меня вылетела из головы. Кстати по теме, один из самых больших демотивационных моментов от работы на Отечество заключается в том, что в Отечестве осталось относительно немного места для системных программистов, все больше бухгалтерию ваяют, из кубиков.

  • Ответить

    Нет, правда, с Дынником вышло неплохо. (((Отечество нужно любить, а не “работать на него” :) (последнее и звучит как-то, по нынешним временам, несколько зловеще))) Ладно, мы отвлеклись…

  • Ответить
    Альтер Эго

    «в Отечестве осталось относительно немного места для системных программистов, все больше бухгалтерию ваяют, из кубиков.» auriga, parallels, paragon-software плюс несколько менее известных.

  • Ответить
    Игорь Ашманов Сам себе компания

    А вот, допустим, маленькая малоизвестная Лаборатория Касперского. 400 млн. долл. годовая выручка, 2 место среди антивирусов в рознице по миру, 4-5 место в мире по выручке. Тут тоже поругаете за что-нибудь?

  • Ответить
    Игорь Ашманов Сам себе компания

    мне кажется делать заявление о том что «таких не осталось» — слишком пафосно и надуто. Есть. Сысоев, например При всём уважении к Игорю (а я его хорошо знаю, это ещё я его нанимал его в Рамблер, глубоко уважаю), он пока всё же не того калибра. Он инженер и сделал выдающееся инженерное произведение. Он из другого вида спорта. Он может вырасти в отечественного Линуса Торвальдса. А Донской был всё-таки учёный. Правда, сравнивать 60-тилетнего и 30-тилетнего некорректно, у людей же по достижениям и известности работает экспонента, так что всё видно будет позже. Есть, есть ещё люди, конечно, но фабрика по их производству в России остановилась в 90-х годах. Возможно, она постепенно снова запустится, как и вообще наша научная машина, дай бог.

  • Ответить
    Альтер Эго

    Я немного невнятно выразился. Под мелочью я скорее имел в виду, что компаний таких очень мало, выбор тоже маленький. Но и в абсолютных цифрах 400 миллионов Касперского с 4 миллиардами Гугл и 12 миллиардами Майкрософт смотрятся не очень выразительно.

  • Ответить
    Игорь Ашманов Сам себе компания

    Игорь пиарщик по совместительству — на два фронта работает: «Касперский_Лаб» + «АиП» Ну да, тут самое место пиарить ЛК, никто ведь не знает. Аж 3000 потенциальных покупателей, ёлы-палы, целый рынок. А что я там про ЛК по существу не так написал? И чей, кстати, пиарщик этот самый ИТман, который спать лечь не может, если не пнуть перед сном что-нибудь маленькое и пузатое отечественное, типа Яндекса или русских программистов вообще?

  • Ответить

    Я как бы сделаю вид, что не заметил, как Игорь переходит на личности. Просто обращу внимание на некоторые ошибки. Во-первых, у меня не та часовая зона, чтобы ложиться спать. Во-вторых, я прокомментировал ощущения Михаила (которого не знал лично, чтобы это утверждать наверняка), что последние энцать лет Россию захлестнула «финансовых» автоматизаций. И все, кто достаточно долго занимался подобными вещами, не с позиции рукоразводящего, а с позиции, человека, который подает ключи и закручивает гайки, знает насколько это скучно, нудно. Другая работа, а-ля Яндекс, Гугл, Аурига, а также «интеллектуальный» аутсорсинг существует, но в небольших количествах. И, кстати, можете поспрашивать людей, каково приходилось этому аутсорсингу на фоне укрепления курса рубля. В то время, как запросы по автоматизации очередного газпрома росли в числе. Ну, и наконец, про русских программистов, вообще. Это какие-то выдумки или попутали меня с кем. Я, наооборот, неоднократно высказывался о их высокой в целом квалификации.

  • Ответить
    Игорь Ашманов Сам себе компания

    Выручка в 400М у ЛК — годовая, а эти цифры у МС и Гугла — скорее всего квартальные или это не выручка, а прибыль. Так что ЛК ещё мельче относительно них. Только сравнивать надо не с ними, а с Макафи и Симантеком, не так ли? Абби тоже уже вторая на своём рынке, как я понимаю. И это с гандикапом лет в пять-десять и те, и другие, не считая разорванной связи времён, оттока умов, отсутствия коммерческой традиции и стартового капитала, кризисов, безумного правления царя Бориса и т.п.

  • Ответить
    Игорь Ашманов Сам себе компания

    Аутсорсинг — это вообще никакое не программирование, это проходит по классу профессиональных услуг, логистики и администрирования там много, программирования мало. Офшорное программирование для России — вредный и тупковый путь, так что чего их сравнивать — да и с кем, с Индией? Так что Аурига — плохой пример. Paralles и Paragon — продуктовые компании, далеко не последние в своём классе. Так что к ним претензий по размеру в своей категории не должно быть, по-моему. А претензия, что вообще таких мало — ну так это претензия к тундре, что растительность бедновата и к тому же не выросла ещё после очередного пожара.

  • Ответить

    Аутсорсинг — это вообще никакое не программирование, это проходит по классу профессиональных услуг, логистики и администрирования там много, программирования мало. Я не знаю, кто там чем занимается в аутсорсинге, но лично я там программировал. По поводу тупиковости этого пути рассуждать можно много, но для начала неплохо было бы оценить сколько людей не ухеали из России только потому, что в России существует(овал) офис Гугла, Борланда, Аутодеска ну или того же Дойчебанка (хотя финансы, как я уже говорил, далеко не всем нравятся)

  • Ответить

    Игорь, я очень скептически отношусь к слову «учёный», наверное тут лучше сравнить со словом «писатель» и отрывком из Булгакова: «А у вас удостоверения есть что вы писатели?». Так и тут: что делает человека ученым? Наличие удостоверения? Ну так у меня есть в жизни пример. Группа «учёных» 20 лет делала одну систему. Я принципиально не укажу публично ни систему, ни «учёных». Пилились деньги, откаты, бюджеты, дачи, квартиры всего не расскажешь, всё это, разумеется, очень научно было. Отмечу лишь одно, что один из ученых, дядечка лет 55—60 если и появлялся у себя, то занят был исключительно своим сайтом с Гербалайфом. На Народе, кажется, сайт был. Так вот, не знаю сколько лет там всё писалось, и какие-то безумные дисеры там были. Видать прижало, появилась необходимость результат показать, ну и взяли такого как я — обычного троешного студента мехмата. Страшно вспомнить, 2 месяца читал, потом плюнул и написал просто и понятно. До сих пор работает и продаётся. А потом нужные люди сделали по моим выкладкам кандидатские, а уж сколько денег-то заработали. Ну и патенты, все дела. Ученых молодых стало больше, но я в их число не вошел. Молодой был, даже не сразу понял что к чему, а когда понял стало всё равно. Кому-то дано щёки дуть, кому-то создавать. Опять же, это было лирическое отступление, к теме Михаила Владимировича отношения не имеющее.

  • Ответить
    Альтер Эго

    pianist Так Ашманов таких ученных описал лучше вас. Они у него называются «физиками» Почитайте его книгу про Рамблер. Таких «учОных» полно в Академии Наук. Поинтересуйтесь сколько денег вбухали во все эти «информационные системы для науки» и посмотрите на эти системы.

  • Ответить

    Игорь, насколько я знаю про Ауригу (у меня там знакомые работали), они там делали вполне себе интересные вещи в районе Voip. Вполне креативненько, не менее чем nginx. На самом деле, не так мало технологических стартапов у которых начальство в штатах, привлекает там венчурные деньги, а разработка — тут. Причем, в самых разных областях. Вот тот же Unified Color (бывшая KWE) — мне их научные результаты кажутся весьма интересными (хотя руки пока не дошли пощупать всерьез).

  • Ответить
    Игорь Ашманов Сам себе компания

    программисты и физики иногда уходят в автомоечный бизнес, Программисты и Физики — почти никогда. Ну так Программисты и Физики с прописных букв и в офшорное программирование не уходят. Это почти что шаурма для них. Вот известный мне программист с большой «П» Женя Веселов — поработал в IBS начальником департамента, уехал в Микрософт. Но я слышал несколько историй про реально крутых программистов и математиков, Божьей милостью, которые в девяностые стали строить банки или торговые структуры. Брокеров из них много, на фондах и форексе. Они реально преуспели в этом, но компьютерная наука, математика и физика их потеряли. Например, программист Сергеев, по многим отзывам Программист с очень большой «П», начинавший делать серьёзный проект собственной СУБД в начале 90-х, ушёл и сделал свою торговую компанию Структура (так и называется). И торговал себе успешно сантехникой и тракторами. Заработал кучу денег, а СУБД не закончил. Что с ним было дальше, не знаю.

  • Ответить

    Ну так Программисты и Физики с прописных букв и в офшорное программирование не уходят. Ну, вот Петю Митричева обозвали программистом с маленькой буквы. Правда он, как мне кажется, человек скромный, не обидится. Но я слышал несколько историй про реально крутых программистов и математиков, Божьей милостью, которые в девяностые стали строить банки или торговые структуры. Я говорю не про тех, которые божье милостью, а те, которым это еще и интересно заниматься. А программисту Сергееву был бизнес, видимо, интереснее. Ведь не с голоду же он умирал, когда Структуру организовывал?

  • Ответить
    Альтер Эго

    Игорь а про какое-такое Программирование вы говорите? Вот у вас на сайте есть несколько примеров ботов, о которых вы любите рассказывать как о большом достижении вашей компании. Гораздо более умные и разговорчивые боты пишут студенты в рамках дипломной работы по graduate курсам искуственного интеллекта. Один человек пишет такого бота в течение нескольких месяцев, выполняя при этом другие дипломные работы и посещая другие курсы. А тут целая компания «специалистов по ИИ» написала примитивный ботик. Про БД. Не знаю про это Сергеев, но вот я помню в сети болталась sql база данных, которую писали в каком-то российском институте проблем программирования или чего большой коллектив. Gnu SQL кажется. Опять же студенты в рамках годичных курсов по базам данных пишут гораздо более серьезные с точки зрения организации индекса, оптимизации запросов работы. Это студенческая работа и ничто большое. «Проба пера» А тут Институт Проблем Программирования Академии Наук, «АВТОРИТЕТЫ», «кафедра баз данных» , а на выходе пшык, который бы я undergraduate студенту незасчитал Вот такое вот «Программирование» , вот такие вот «серьезные» боты и базы данных, структурЫ.

  • Ответить
    Альтер Эго

    А Михаил был программист от Бога. и ученый. Жалко, что такие люди уходят. Когда говорите про другие великие имена, не забывайте Поспелова, и Разборова, который говорят расматривался комитетом премии Тьюринга

  • Ответить

    Ну, и напоследок про стольк нелюбимые Игорем Станиславовичем офшоры и аутсорсинг. Если Игорь Станиславович считает, что офшоры и аутсорсинг — это тупик, зачем же тогда его компания делает какие-то проекты для Гугл? Я считая, что в данном случае принципиальность не помешает. Либо мы не делаем аутсорсинговые проекты для иностранных компаний, либо не говорим, что это тупик, в который настоящие Программисты не заходят.

  • Ответить
    Игорь Ашманов Сам себе компания

    Вот у вас на сайте есть несколько примеров ботов, о которых вы любите рассказывать как о большом достижении вашей компании. По-моему, вам нужно перечитывать то, что вы написали перед отправкой. Иначе получается чушь: а) у меня на сайте нет никаких ботов. б) есть компания Наносемантика, у неё боты есть. У неё свой генеральный директор и свои программисты. в) я нигде не рассказывал об этих ботах и не говорил, что это большое достижение или что это достижение моей компании. Это вы выдумали. Ну и наконец, г) я нигде не говорил о себе, как о программисте, программисте с большой буквы или учёном, так что вообще непонятно, к чему вы этот разговор завели. Вы против чего согласны? С чем спорите? Я не Донской и не Веселов, у меня на этот счёт иллюзий нет. P.S. Что касается этих ботов, то это обычный разговор профана, о том, что любую задачу решает студент, пишущий курсовую. Я это не раз слышал и про поисковик, и про проверку правописания, и про машинную морфологию, и про электронный словарь, и про машинный переводчик даже. Просто вы задачу не понимаете и не можете отличить, насколько она решена. Вы для начала сходите поговорите с известным A.L.I.C.E bot, который пишется многочисленными студентами, аспирантами и сторонниками Ричарда Волласа уже лет десять и выигрывает призы Лёбнера, посмотрим, что вы скажете про качество и курсовые. В любом случае, здесь не место для этого унылого флейма.

  • Ответить
    Игорь Ашманов Сам себе компания

    Если Игорь Станиславович считает, что офшоры и аутсорсинг — это тупик, зачем же тогда его компания делает какие-то проекты для Гугл? Это тупик для страны и для компьютерной науки. А также для тех, кто хочет стать программистом с большой буквы. Заказное программирование, по-моему, убивает Программирование. А деньги так зарабатывать можно. Проекты с Гуглом у нас действительно были, сейчас уже нет. К тому же они были маркетинговые, а не разработка. Либо мы не делаем аутсорсинговые проекты для иностранных компаний, либо не говорим, что это тупик, в который настоящие Программисты не заходят. А я себя не считаю настоящим Программистом. Мне — можно. Да и то, мы на заказ не программируем, мы иногда продаём свои технологии с внедрением.

  • Ответить

    Зря аутсорсинг ругаете. В далеком 2001 году работал там. Многое из того, что уже тогда отлично работало там, только недавно пришло собственно в российские компании — ночные билды, регрессионное тестирование, контроль версий, автоматическая документация, багтрекинг, отсутствие «собственных велосипедов» и криков «все, что не написано нами, отстой». Что интересно, нормальная организация процесса разработки была не только в таких крупных компаниях как Аурига, но даже в небольших — 10-15 программистов. Примерно в том же году в одной из названных здесь российских «продуктовых» компаний программисты не могли договориться о coding conventions, а автоматического документирования и багтрекинга либо не было, либо было настолько формально (для галочки), что приходилось идти в соседний отдел с вопросами «а чего и зачем это тут понаписали». Так что программисту не так важно, «продукт» ли он делает или «заказ». А вот бардак и отсутствие нормального организованного процесса разработки сильно портили впечатление.

  • Ответить

    Рунет Р, спасибо! Еще от себя хочу добавить, что для фолиантных червей вроде меня можно найти работу не только и не столько хорошо организованную, но еще и интересную. Примерно в том же 2001 году я работал год на компанию Телелингва, для которой я ремонтировал и оптимизировал движок для поиска похожих предложений, попутно ковырясь и патча текущий RTF-парсер, разрабатывая HTML-aligner (кто видел Trados поймет что это) и осваивая COM. Для сравнения, на моем основном месте я работы я сопровождал БУХГАЛТЕРИЮ, ОДНОЙ компании уже третий год и которая мне к этому моменту совершенно остоЖЕНСКИЙПОЛОВОЙОРГАНла.

  • Ответить
    Альтер Эго

    http://www.polit.ru/science/2008/08/20/programmist_print.html А я там сразу опускаюсь на 8-10 ступенек в социальной лестнице. Немедленно. Я попадаю в ситуацию где…, Интересно, о чем он говорит. Он — человек умный и предприимчивый, легко бы нашел себе место в силиконовой долине. А так он говорит, как будто он профессор из Германии, где статус полного профессора сравним со статусом министра социально собирается переезжать в Италию, где статус профессора крайне низок. Вот недавно мой друг, не руководитель фирмы, но очень хороший и много получающий программист познакомился с девушкой. Хорошо провели вечер, но после того как он ей рассказал, что он «компьютерщик», она его попросила ей не звонить. Таких случаев знаю много. Конечно, есть какой-то там высший круг «Билл Гейтс встречался с Чубайсом», но «компьютерщики», во все испостасях, включая долларовых миллионеров явно не относятся к элите, и к высокому социальному статусу в российском обществе. Думаю в силиконовой долине социальный статус был бы повыше

  • Ответить

    2 Alter Ego Может быть твоему другу надо было зубы почистить или носки постирать? Ну или просто девушке не понравился? Она весь вечер терпела и искала повод чтобы ему отказать? Девушки существа ооочень своеобразные, но ИТ к этому имеет очень мало отношения…

  • Ответить

    Второй эге 1. Очень хорошая девушка. А “компьютерщик” – это что за зверь? Это ”электронщик”(т.е. сегодня “ремонтщик”)? Или ”системщик”? Но ведь, как понимаю, он ни то и ни другое. Некрасиво девушек обманывать в столь важном для любой девушки :) 2. “профессор из Германии, где статус полного профессора сравним со статусом министра социально собирается переезжать в Италию, где статус профессора крайне низок” – О, русо туристо облико когнито!

  • Ответить

    Хорошо провели вечер, но после того как он ей рассказал, что он «компьютерщик», она его попросила ей не звонить. Таких случаев знаю много Может просто девушка плохо провела вечер и нашла первый удобный предлог, чтобы отвязаться от плохого любовника. Лично я, например, слышал, что быть программистом — это cool. От девушки, опять же. И догадайдесь почему. Потому как в стране чистогана средняя зарплата 30 с копейками в год, средняя зарплата white Caucasian 50 в год, а средняя зарплата программиста — 90 в год. Нет, я не спорю, что врачи, юристы и капиталисты в статусе выше программистов, но в России зато есть капиталисты, а также бандиты и политики, по сравнению с которыми мы вне конкуренции.

  • Ответить
    Альтер Эго

    Юзеру Бузик 2 я не понял причем тут туристо, я в германии и италии провел достаточно времени как visiting professor и прекрасно знаю обе страны Итман Что мне рассказали, я то вам и передал. Не добавил, не убавил, почему она ему отказала не знаю. Но жалобы российскиз программистов, опять же далеко не последних, про низкий социальный статус слышал неоднократно Про 90 в год, вы, наверное, говорите про Америку. Я же говорил про Россию. Политик, конечно, гораздо более «авторитетная» профессия по сравнению с программистом, молодые нашисты более популярны

  • Ответить

    Никто из уехавших назад всей правды не скажет. Но лично моя теория заключается в том, что пока ты там не получишь вид на жительство, то ты фактически очень ограничен в свободе выборы работы и перемещения. Кроме того, многие наши программисты уж так плохо говорят по-английски (прости господи просто ужасно даже прожив 10 лет в стране), что только этот уже делает их людьми второго сорта в глазах местных.

  • Ответить

    2 Alter Ego Про отношение Игоря (Станиславовича Ашманова) к программированию могу рассказать я, ибо он из скромности явно не будет этого делать. Только уж представьтесь сначала. Пожалуйста.

  • Ответить
    Альтер Эго

    Очень понравилась эта статья Донского (самая первая в блоге) http://itblogs.ru/blogs/donskoy/default.aspx Он очень правильно подмечает, что любой серьезный проект должен иметь свой инструментарий с нуля. Единственное, что не верно, это то, что сейчас принято в иначе. Свой инструментарий с нуля есть почти в каждом серьезной проекте. Вот, в той же IBM для проектов уровня DB2 используется не только полностью переписанные под нужды этого проекта, но даже компилятор почти полностью переписан (основа GNUсный C++). Используются свои (очень сильно переписанные стандартные) средства сборки, контроля версий, ну и конечно, парадигмы и стили кодирования. Во всех компаниях, в котором мне приходилось работать и обитать (в рамках визитов) я видел это. Очень интересно было увидеть это же у человека, начинавшего программировать в ассемблерные коды.

  • Ответить
    Альтер Эго

    s/в ассемблерные коды/до ассемблерные годы/ Игорю Станиславовичу. Вы и вправду думаете, что Ваши читатели никогда не программировали собственных ботов, из студенты не программировали ботов и вся эта тема пустое место?

  • Ответить
    Игорь Ашманов Сам себе компания

    Я думаю, что все всё программировали, все разбираются во всём и всё такое. Ещё я думаю, что это бодание в стиле «а ты кто такой» в этой нитке обсуждения неуместно.

  • Ответить
    Альтер Эго

    Мне интересно другое Донской с сожалением рассказывает о смерти советской элементной базы В 90ые годы мне это сожаление доводилось слышать от многих программистов и хардверщиков того поколения А как это решение о переходе на копирование ИБМ выглядит сейчас? В начале 90х основными программами были Фортран с бесчисленными библиотеками, компилятор С++, некоторое множество редакторов и прочих утилит. Все это было сравнительно легко поддерживать для различных платформ В 90ые пришли стали массово-коммерческими большие продукты — которые трудно поддерживать для различных платформ — без существования которых данная платформа мала интересна для конечных пользователей Это САПРы, базы данных, среды разработки, бесчисленные ERP/CRM итд Ряд платформ вымер DEC, Next, многие платформы строящиехся по заказу суперкомпьютеры (вычислительно равные кластеру линукс машин) или занял достаточно теневые нишы (риск от HP) Допустим советское руководство не стало бы копировать ИБМ, а стало поддерживать свою элементную базу. Что было бы к началу 90х, когда компьютер перестал быть средством счета? Стали бы Oracle,SAP, Microsoft поддерживать версии своих продуктов для Russian Chip & Russian OS Вряд ли В итоге платформа бы умерла,, ну может быть заняла бы какую-нибудь нишу в министерстве обороны но умерла быс огромными затратами на ее разработку, трудом огромного количества людей

  • Ответить

    Вопрос про платформы — он довольно интересный. Те же DEC-и померли в условиях открытой конкуренции, где выживают те у кого больше тираж. Чуть более закрытые условия — и платформа может жить. С софтом ситуация в этом смысле проще: если оно уже многоплатформенное, как у Oracle или IBM, то плюс одна платформа — не так и сложно. И еще в конце 90-х это все мы видели, ибо платформ было реально много. Да и сейчас платформа не одна, ибо мобильные телефоны вполне достигли уровня суперкомпьютеров 70-х. Но самый интересный тут — именно философский вопрос про лишнюю трату ресурсов. Допустим, была бы совсем своя платформа, БЭСМ-2008. Допустим, на ее поддержку тратились бы существенно большие усилия, чем на поддержку офисных виндов по всей стране. Вроде как плохо, усилия тратятся нерационально, что противно глобализации. С другой стороны, эти усилия более креативны, чем переинсталляция оных виндов, что полезно ибо повышает общий уровень. А что касается нерациональной траты ресурсов: я когда на Вернадского-33 в первом этаже одного дома вижу 5 или 6 банковских офисов (каждый раз удивляюсь) — тоже считаю это довольно странной тратой ресурсов.

  • Ответить
    Альтер Эго

    вопрос в тему Какое число пользователей необходимо, чтобы поддерживать отдельную платформу Мак долго существовал как достаточно теневая система, ДЕК тоже был теневой системой (я выбираю малые платформы, а не большие существовавшие на госзаказы) Вот в РФ неоднократно пытались разработать свой СУБД Уже упоминали GNU SQL, который разрабатывали в ИПИ РАН, еще была такая система Линтер Ничего путного не получилось, все же СУБД, это не интернет почтовик и не антивирус, тут требуется огромное число высококлассифицированных программистов, чтобы сделать что-то путное сравнимое с Oracle С другой стороны с развитием интернет и малых платформ появились малые СУБД, вроде MySql Интересно может ли появиться такая российская система. Нужно ли для этого какое-то минимальное число пользователей, чтобы система смогла существоватьи поддерживаться

  • Ответить
    Игорь Ашманов Сам себе компания

    Допустим советское руководство не стало бы копировать ИБМ, а стало поддерживать свою элементную базу. Что было бы к началу 90х, когда компьютер перестал быть средством счета? Стали бы Oracle,SAP, Microsoft поддерживать версии своих продуктов для Russian Chip & Russian OS. Это ваше рассуждение логически порочно, в него заранее заложено предположение о зависимости от западного развития ИТ. Если бы решили быть независимыми, а всё-таки были бы зависимыми, то дёргаться было бы хуже, чем просто сразу стать зависимыми. Это очень напоминает известное рассуждение Алисы: «хорошо, что я не люблю спаржу. Если бы я её любила, мне прилось бы её есть, а я её просто ненавижу». Если бы в СССР упорно развивали свою элементную и программную базу, то не было бы такой зависимости от западного софта и железа. Тогда и не было бы проблемы с поддержкой Оракла и Микрософта.

  • Ответить

    2 Alter Ego 18.01.2009 01:17:28 До сих пор к тинам я относился, скажем, лояльно. Хотя, согласитесь, трудно слушать тех, у кого через слово “короче” и его (для меня совершенно неожиданный) эквивалент “социально” ;)

  • Ответить
    Альтер Эго

    «я когда на Вернадского-33 в первом этаже одного дома вижу 5 или 6 банковских офисов (каждый раз удивляюсь) — тоже считаю это довольно странной тратой ресурсов. » А похожие сервисы просмотра/закачки видео, файлообменники, похожие блогхостинги, похожие социальные сети у нескольких разных компаний — это не странная трата ресурсов? Или жизненно необходимо иметь 5 разновидностей youtube и 5 разновидностей одноклассников?

  • Ответить

    Игорь, старожилы все еще помнят среднюю наработку на отказ у МГУ-шной БЭСМ-6. Ругаюцца матом. Т.е. серьезнейшая проблема была в том, что секретная технология «сборка трезвым» употреблялась далеко не так широко, как хотелось бы. И оно продолжается до сих пор, знакомые вынужденные по условиям заказчика иметь дело с российской-белорусской технологической базой — ругаются очень нехорошими словами. Это могло бы дать интереснейший эффект: технологии надежного дублирования появились бы на 20-30 лет раньше, а невозможность по технологическим причинам сделать быстрый процессор на принятом сегодня подходе — вынудило бы на те же 20-30 лет раньше заниматься распараллеливанием. Эффект мог бы быть интересным. А мог бы быть и какой-то третий путь, в этом смысле меня история про криптокалькуляторы (см. книжку Масленникова) продолжает забавлять, натурально электронная подпись из палки и веревки. Вместе с тем, в 60-70-80-е годы предпочитали прямую гонку (Шаттл-Буран как один из примеров), которую скорее всего проиграли бы. Если бы примеров ассиметричного ответа в том прошлом было бы много — я не был бы столь скептичен.

  • Ответить
    Альтер Эго

    Я сомневаюсь, что мы могли бы стать независимы от «западного пути» (чтобы это не значило, западной и восточной информатики не существует, также как и не существует западной и восточной физики)…. не потому, что у нас не хватает компьютерных и математических гениев, а по экономическим причинам. Вся информатика на западе от баз данных до интерфейсов, от микросхем памяти и шин до цпу разрабатывалась в силу того, что были экономические запросы общества. Конечно, в 50и 60ые годы министерство обороны США закупало процессоры, тем самым снизив их стоимость в десятки раз и сделав доступными для промышленного производства и использования, конечно, DARPA финансировала ряд проектов позволив их развить энтузиастами в университетах, но средние и конечные стадии всегда были массово-коммерческие А этого в советском союзе не было, общество не требовало ни серьезных баз данных, которые могли существовать за пределами ГосПлана, ни систем продаж билетов Интересный пример Япония. Они заняли достаточно большие ниши в элементаной базе в следствии господдержки. но опять же это все смогло произости благодаря коммерческому спросу на их продукты в самой Японии (консюмерская электроника) и за пределами (США, Европа, консюмерская электроника). В СССР простая электроника для простых людей почти не производилась (вспомните, хотя бы бабинные магнитофоны). Интересна ситуация на современном рынке. Ведь тоже копируют и западные сервисы и алгоритмы. Не думаю, что потому, что нет отечественных умов, просто так дешевле Пример, в исследовательской литературе можно найти …я сразу знаю примерно..5 альтернатив PageRank, который в чем-то лучше, в чем-то хуже его, но отличны по принципам. Но наши промышленники предпочитают развивать копии PageRank потому, что известно, что он работает, и чтобы разработать 1 хороший вариант надо попробовать 20 плохих А это накладно. Легче копировать Тоже самое относится к вопросу почему наши компании копируют Flikr, Faceboook, Classmates, Linkedin, Technorati News(Yahoo, Google) etc. Эти модели работают, это известно, экспериментов ставить не надо, рисковать не надо. Экономика. Вообщем, мне кажется было крайне мало шансов создания советского пути развития вычислительной техники. По экономическим мотивам.

  • Ответить

    Но наши промышленники предпочитают развивать копии PageRank потому, что известно, что он работает, и чтобы разработать 1 хороший вариант надо попробовать 20 плохих Это шедеврально, То есть Яндекс с Рамблером скопировали ПейджРанк? Вы точно в этом уверены, может они все-таки используют собственные альтернативы? Тоже самое относится к вопросу почему наши компании копируют Flikr, Faceboook, Classmates, Linkedin, Technorati News(Yahoo, Google) etc. Google появился позже Рамблера с Яндексом, но молодежь ведь не помнит историю? Хотя многие сервисы действительно клонируются. Cлучай копирования я знаю только один: уж прости-господи не помню кто скопировал интерфейс кажется linked in. Кто-то из молодежи. :-) не помнящей уже, что Яндекс с Рамблером и Апартом не копировали Гугл :-)

  • Ответить
    Альтер Эго

    Еще у Донского мне понравилась одна вещь, которую он очень тонко подметил Очень сложно оценить вклад ученых того поколения, так как многие вещи сейчас кажутся очевидными. Вот вроде бы придумал хэш таблицы, или алгоритм потоков на сетях Вроде бы это очевидно, так как это дается на уроках информатики в школе. Совершенно трудно оценить насколько трудно это было придумать и увидеть в первый раз. Совсем как в физике. Сохранения энергии сейчас совершенно очевидно и интуивно, как обжигание пальца кипятком. Но надо было бы докторм Майерсом, чтобы увидеть этот закон в разнице цветов крови в тропиках и на севере, и понять, что это связано с сжиганием кислорода, а значит расходом энергии. Волновая природа света очевидно. Но надо было быть Янгом, чтобы в 18 веке додуматься пропустить свет через две щели (с чего бы? весьма не очевидно если начинать с нуля?) чтобы прийти к таким демонстрациям волновой природы света. Это был прорыв, который крайне трудно оценить сейчас, когда все это перешло в разряд элементарной и средней школы.

  • Ответить
    Альтер Эго

    вот и Сонин о том же самом http://www.vedomosti.ru/newspaper/article.shtml?2009/01/19/177418 «Шоколадница» и «Кофе-хауз», «Яндекс» и «Одноклассники.ру», ритейлеры и операторы мобильной связи, чуть ли не все глянцевые журналы и телеканалы, строительство и тысячи других бизнесов сэкономили миллионные затраты и годы поиска наилучших решений, скопировав и адаптировав разработки заграничных первопроходцев. Не так-то просто назвать успешный российский бизнес, в котором существенная часть организационной структуры, маркетинговой стратегии и технологии производства не была бы заимствована из-за границы. это тот же Сонин, что http://ksonin.livejournal.com/

  • Ответить
    Игорь Ашманов Сам себе компания

    Хоть я и сижу с этим Сониным в одном здании и езжу с ним лифте эпизодически, и на вид он приятный парень, пишет он ерунду, по-моему. То ли по непониманию, то ли по классовому сродству советского интеллигента, который не может не стараться всё сделать по-западному. Он призывает «действовать решительно», что у него означает как можно быстрее привлекать иностранный капитал и вступать в ВТО, то есть повышать уровень глобализации и зависимости. А мне кажется, что именно от излишней глобализации нас сейчас колбасит, от свертекучести капитала и дешёвых западных денег, на которые все подсели, как на иглу. И что, наоборот, как и в 1998 году, кризис у нас приводит к уменьшению доли иностранцев в экономике, к появлению своих производителей и продавцов, и это хорошо. И некоторое закрытие экономики, как писал ещё давно Паршев, нам только поможет. Ну и в деталях Сонин провирается. Яндекс ничего не копировал, многие вещи он делал раньше Гугла. Наука о поиске информации (IR) у нас в 60-70-80-х развивалась не медленнее западной и все вещи про индексацию, вычисление различительной силы термина и т.п. у нас были придуманы самостоятельно. Яндекс, собственно и начался раньше Гугла. Что касается странного утверждения, что Яндекс скопировал именно PageRank, «а не пять других известных алгоритмов» — этот-то факт вам откуда известен? Мало того, что это неизвестно; более менее известно, что сам-то Гугл давно классический PageRank не использует, насколько можно судить. Судить про то, что могло бы быть — невозможно. Но почему холодильники и мебель могли существовать в СССР, хоть это и продукты массового спроса, а персональные компьютеры — нет? Почему вообще ИТ должны были идти по пути персональных компьютеров, а не сетевых терминалов, например? В СССР были тысячи больших машин. Может, их стали бы десятки и сотни тысяч, а в телефонах появился бы экран, как у Минителя? Мы в результате проигрыша Третьей мировой войны приняли западную модель ИТ, ориентированную на обильное частное потребление, но почему она должна быть единственно верной?

  • Ответить
    Альтер Эго

    Холодильники и мебель в СССР были совсем говенного качества. Все стояли в годовых очередях за привозными «стенками» и «креслами-кроватями». Да, даже советскую мебель можно было получить в порядке несколько месячной или годовой очереди. Про холодильники и говорить не приходится. Советские постоянно протекали фреоном, коротило провода, горел мотор, качающий фреон. Никаких удобств вроде отделений для газированной воды и в помине не было Это хорошо, что мы не создали компьютерной техники, которая выглядела бы по сравнению с ПСшками, так же как советские холодильники, мебель, автомобили, магнитофоны выглядели по сравнению с западными

  • Ответить

    Ответ Ашманову: *** И некоторое закрытие экономики, как писал ещё давно Паршев, нам только поможет. *** Вы говорите про Паршева, автора опуса «Почему Россия не Америка»? Вы совершенно зря воспринимаете Паршева всерьез, ибо он не профессиональный экономист, а, насколько я помню из какой-то публикации, полковник погранвойск. Кроме этого, Паршев никогда не жил в США и имеет об американской жизни совершенно фантастические предствления. *** Ну и в деталях Сонин провирается. Яндекс ничего не копировал, многие вещи он делал раньше Гугла. *** А вы что, считаете, что Гугл был первой или одной из первых поисковых компаний? За много лет до Гугла и существовала например компания Verity которая сделала ранний search engine для американских военных. Мне эта компания еще в 1995 году сделала job offer так что я знаю ее историю: http://www.fundinguniverse.com/company-histories/Verity-Inc-Company-History.html *** Но почему холодильники и мебель могли существовать в СССР, хоть это и продукты массового спроса, а персональные компьютеры — нет? *** Насколько я помню из общения с зеленоградовцами, СССР ввозило оборудование для Зеленограда из Японии. Для копирования i8080 и i8086 экспертизы, оборудования и т.д. было достаточно, но уже с копированием 386 была напряженка. И вообще, давайте я расскажу пару историй из своего личного опыта: 1. Отставание в военной технике В начале 1980-х на советских истребителях МиГ-29 использовалась бортовая вычислительная машина Орбита-20/700. Я написал для нее кросс-компилятор Си в 1990-м, переписав часть PCC (Portable C Compiler от AT&T). Орбита-20/700 была построена НА ТРАНЗИСТОРАХ в конце 1970-х, когда на западе уже начали проектировать 32-битные микропроцессоры (Motorola 68000, 1979). 2. Отставание в суперкомпьютерах В 1988-1989 годах я участвовал в в проекте Электроники СС-БИС (копии Cray-1, ее прозвали «Красным Креем»). Я писал часть Си-компилятора. Компьютеры этого типа использовались для задач типа моделирования ядерного взрыва. Они были альтернативой Эльбрусам и МКП. Для этого проекта был создан Институт Проблем Кибернетики и академик Мельников был поставлен управлять проектом. Американский Cray-1 был создан в 1976-м году. Советский начали делать в начале 80-х, и к 1991-му году, когда он безнадежно устарел, были выпущены его типа четыре экземпляра, которые не работали. Все это было следствием отсутствия культуры частного предпринимательства, и изоляции СССР от мирового рынка Вообще советская система внедрения инноваций не имеет ни единого шанса против системы, которую я описал в статье http://panchul.com/wordpress/2008/09/10/silicon_valley Советская система могла по большому счету делать направленные госпроекты с четко поставленной и ясной инженерной задачей (типа полета Гагарина). Такой подход не работает, когда ситуация в индустрии быстро меняется и трудно прогнозировать, что будет изобретено в следущем году. Насколько я понимаю, в России в последние годы появили фонды венчурных капиталистов, но у меня сложилось впечатление, что до уровня американской инфраструктуры (как я описал в статье выше) еще весьма далеко. *** Мы в результате проигрыша Третьей мировой войны приняли западную модель ИТ, ориентированную на обильное частное потребление, но почему она должна быть единственно верной? *** Фишка не в том, что она не единственна, фишка в том, что в соревновании плановой против рыночной экономики плановая проиграет. *** Мы в результате проигрыша Третьей мировой войны приняли западную модель ИТ, ориентированную на обильное частное потребление, но почему она должна быть единственно верной? *** В СССР был самый большой культ потребления в мире, причем по привычке он остался у русских 1990-х, даже у иммигрантов. В начале 1980-х советские девушки экономили на еде месяцами, чтобы купить с рук фирмовые джинсы, которые стоили больше средней советской зарплаты. Такую реакцию на барахлецо я не встречал даже у всяких бедных студенток из Индонезии и Венесуэлы. СССР был обществом культа потребления без нормального потребления как такового.

  • Ответить

    Пресловутое «технологическое отставание от запада» — это не миф, к сожалению. Причем, не только в электронике (хотя компьютеры и цветные телевизоры навязли в зубах). Вот милая моему сердцу фототехника: в 60-е годы масса новых идей, золотые медали на европейских выставках и т.п., в 70-е — стагнация, но все еще как-то на уровне, 80-е иначе чем полной катастрофой (если сравниваться с японцами-немцами) я не могу назвать. В конце 80-х я имел счастье работать на советском электронном микроскопе. К несчастью для себя, до того я немножко поработал на английском и имел возможность сравнивать. Да что электронный, обычные оптические микроскопы были чудовищными. Опять была возможность сравнить. Причем, дело тут не в какой-то глубинной отечественной особенности, оптические микроскопы ЛОМО 90-х годов (или начала 2000-х, уже не помню) вполне ничего. И оптическое стекло из Лыткарино позволяет оному Лыткарину выигрывать мегатендеры у буржуев. Просто такое впечатление, что в 70-е развитие встало лет на 20, а как-то возобновилось буквально несколько лет назад. Одна из общеэкономических теорий заключается в том, что для поддержания полной технологической пирамиды на ходу нормальными методами (без тотальной мобилизации) — нужно иметь рынок сбыта (размер экономики) на несколько миллиардов человек. Без этого — да, можно всей страной сделать Буран или развернуть 300 пусковых Р36-М, но цена отвлечения народа на эти задачи будет довольно высокой.

  • Ответить

    А зачем там вообще был нужен кросс-компилятор? Судя по тому, что компьютер был на транзисторах, вряд ли там было больше пары килобайт памяти. Для такого объема вполне можно писать программы в кодах или на ассемблере.

  • Ответить

    Если коротко. У нас в лаборатори (а я химиком был) была куча технологий не просто лучших западных, а принципиально отсутстовавших у них. И двух-трехкратное превосходство в выходе продукции, принципиально новые свойства соединений и материалов это вообще постоянно. Но … все это была бумага — у заводов не было причины внедрять эти технологии. Новая технология это риск, а план никто не снимал. Так и делали по старинке фигню. И горели советские телевизоры от того, что на ДЗХР (Донецкий Завод Химреактивов) в производстве ферритов для силового трансформатора рабочие выломали последнюю термопару в печи… При том, что в лаборатории наши ферриты просто на класс были лучше. Еще пример. Я радиолюбительством занимался. Помню как 60-е годы была статья о том, что японцы сделали телевизор на «твердых» схемах, которые помещался в жилетном кармане. Все удивились, а через 8 месяцев наш любитель сделал телевизор меньше, на массовых дискретных элементах, трубке от осцилографа (там куча всего было впревые сделално — схема прямого усиления, провод к наушнику как антена итд итп). Ну и что? Я этот телевизор в 80-м году на ВДНХ видел. Он так и был сделан в одном экземпляре (( Т.е. в одном экземпляре мы могли почти все. А вот в производство пустить….

  • Ответить
    Игорь Ашманов Сам себе компания

    Это всё известные вещи. Однако, тут постоянно возникает логическая ошибка. Только что выше написали, что ещё в 60-х и 70-х было всё нормально, а потом вдруг всё встало. Замечу, что холодильники 60-х годов работают до сих пор и не ломаются. И они были вполне на уровне мировой индустрии. Все претензии — к холодильникам конца 70-х и позже. При этом научная машина в 7-80-х вообще набрала большой ход. Вопрос в том, отчего «всё встало». Поскольку есть уже общепринятый миф, что это из-за встроенной неэффективности самой системы, и что есть единственный путь — а именно рыночный западный, то все остальные рассуждения выводятся автоматически. И про венчурную модель, и про рынок на несколько миллиардов и т.п. Это именно логическая ошибка, состоящая в изначальном задании неявных, невербализованных аксиом. При этом заметим, что попытка встать на правильный путь в нашей стране привела к полному развалу в течение 20 лет. Сейчас мы начали вроде этот развал как-то исправлять, а глашатаи этой (идео-) логической ошибки вроде Сонина говорят, что нужно решительно продолжать то, что делалось в 90-е. Поразительно, что параллельно развивается Китай, который явно, наглядно опровергает эту теорию: там точно пошли другим путём и никогда не делали этой логической ошибки. У них до сих пор формально «коммунизм» и контролируемое им общество потребления. И никакого развала, даже кризиса по сути нет, один безудержный рост. Но Китай же — пугало для наших либеральных экономистов, он же такой несвободный и вообще ужасный. Но при этом китайцы избегли развала страны, разрушения экономики, армии, здравоохранения, образования и аккуратно как бы демонтируют коммунизм. Да, я знаю обо всех отличиях, о том, что у них был запас необразованности и бедности, что их там миллиард с хреном и т.п. Это ничего не меняет на самом деле. Ну ладно, это такая избитая тема, не для этого топика. Я просто хотел указать на порочность самой схемы рассуждений. Вы берёте за аксиому единственность правильного пути (тетрады «рынок, демократия, гласность, права человека») и выводите негодность системы (и чуть ли не самой страны и народа) из конкретных следствий типа холодильника. При этом негодность второй системы для нашей страны вы отказываетесь признавать, даже видя гораздо худшие конкретные следствия в вашем же городе и подъезде.

  • Ответить

    Ответ itman-у *** А зачем там вообще был нужен кросс-компилятор? Судя по тому, что компьютер был на транзисторах, вряд ли там было больше пары килобайт памяти. Для такого объема вполне можно писать программы в кодах или на ассемблере. *** В «Орбитах» была словная архитектура с раздельной ОЗУ и ПЗУ. ОЗУ была действительно пара килослов, но ПЗУ была побольше — я уже не помню точно, типа 16 килослов. Для этого размера Си-компилятор уже начинает быть полезным, если все хорошо оптимизировать (ох, там приходилось иметь пять типов указателей — указатель на текущую страницу ОЗУ, указатель на все ОЗУ, указатель на ПЗУ и т.д.). Вспомните, что в 8-битных компьютерах с CP/M той же эпохи на C вполне писали, хотя на них было от 16KB до 64KB памяти. В 1985 Yamaha MSX-1 c Z80 и 64KB памяти бОльшая часть программ писалась на C. Кроме этого, насколько я помню, только первые «Орбиты» были на транзисторах. Потом, если я не ошибаюсь, были модификации на микросхемах.

  • Ответить
    Альтер Эго

    Когда я говорил про PageRanк, конечно, же я не имел ввиду конкретную модель вычислений описанную в статье за 1997 год я говорил про модель веба как графа, в котором вершины получают вес, а линки передают этот вес от входа к выходу, чем больше вход тем больше выход. Насколько я могу судить по российским сеофорумам, обсуждающим, где и как поставить линки на свой сайт, именно эта модель используется большинством российских поисковиков (под кого конкретно оптимизируют российские сеооптимизаторы — Нигму, Яндекс, Рамблер, Апорт я не знаю) . Конкретная модель и чем выходная матрица отличается от стохастической матрицы не столь важно, все эти малые операторы возмущения, принципиальной разницы в модель не вносят Модель как вы знаете не единственная, см к примеру выступления MS в этом году, по поводу модели основанной на поведении пользователей, в той же статье вы найдете ссылк на другие принципиально отличные от пейджранка модели

  • Ответить

    Ok, я понял про компьютер. Действительно для таких имело смысл писать компилятор. Более того, пример с Ямахой мне очень близок, благо это был первый сишный компилятор, который я использовал в своей жизни! Альтер: если это не та модель, то не нужно бросаться неумными фразами, что Яндекс содрал пейджранк. Вы там написали, что Яндекс содрал, потому что не хотел развивать варианты. А Яндекс как раз развивал свой вариант. Коих были миллиарды еще до Гугла, например алгоритм Кляйнберга

  • Ответить
    Альтер Эго

    itman в моем посту не было ни слова про яндекс, это вы сами додумали алгоритм кляйнберга вы про тот где два типа вершин? или что-то другое? это совсем другая опера

  • Ответить
    Альтер Эго

    А вот Ашманов, как самый большой специалист в российском ИР тут может прояснить кто развивал модели на графе как сети в 1997 году а кто трактовал странички просто как наборы текста с tf-idf и прочими традиционными штучками

  • Ответить

    Пример, в исследовательской литературе можно найти …я сразу знаю примерно..5 альтернатив PageRank, который в чем-то лучше, в чем-то хуже его, но отличны по принципам. Но наши промышленники предпочитают развивать копии PageRank потому, что известно, что он работает, и чтобы разработать 1 хороший вариант надо попробовать 20 плохих А это накладно. Легче копировать Яндекс у нас не промышленник что ли? http://en.wikipedia.org/wiki/HITS_algorithm#Algorithm Это та же опера, а не другая. Это вариация на тему взвешенного индекса цитирования, стыдно про нее не знать. И, вообще, было бы неплохо определиться, что Вы там называете альтернативами пейджранк. Потому как я примерно представляю себе альтернативу, как алгоритм основанный на понятии ссылочного цитирования (которое изобрели еще до интернета) А Вы видимо нечто вроде user popularity, click popularity ,etc…

  • Ответить
    Альтер Эго

    У вас явная проблема с силлогизмами Там же не было сказано *все* наши промышленники Я говорил про HITS если вы хоть немного разберетесь в алгоритме (а не будете ограничивать свое образование заметками из википедии), увидите почему я сказал «это из другой оперы»

  • Ответить
    Игорь Ашманов Сам себе компания

    Я не самый большой специалист, поэтому даже отвечать не буду. Сегаловича или Харина спросите. Здесь уже развилась психологическая игра по Берну, называемая тараканы: один вбрасывает тему, что вот, в доме тараканы, что делать, типа, а другие ему предлагают по доброте душевной разные средства. А зачинщик игры с торжеством опровергает: «пробовал, пробовал, не работает, знаю, знаю…». Все получаются статисты, невольно подающие пасы, а он — красавец, осознанно или бессознательно использующий их для самоутверждения. Вот и здесь то же самое: набросили глупую мысль, что в СССР науки и программирования не было, а всё скопировано, а теперь мы же ещё и будем набрасывать пасы — а вот же книги, а вот же разработки. А зачинщик игры будет легко и бездумно опровергать, получая психологическое преимущество. Спасибо, я сыграю в другой раз. Вы совершенно зря воспринимаете Паршева всерьез, ибо он не профессиональный экономист, а, насколько я помню из какой-то публикации, полковник погранвойск. Ну да, действительно. Кто ему разрешил!!! Знаете, на своём жизненном опыте я научился воспринимать всерьёз людей просто умных и добросовестных, а не увенчанных регалиями или как бы профессионализмом. Что нам профессиональные экономисты? Мало того, что в экономике как-то мало кто разбирается и управлять ей не могут, несмотря на степени. У нас есть вообще негативный опыт с профессиональными экономистами: в 90-х экономику страны разваливала свора людей именно что с высокими научными степенями по экономике, от докторов до академиков. Ну и вот этот текущий кризис — где были 99% «профессиональных экономистов» даже не год, а полгода назад? А я скажу где: пророчили рост на годы вперёд и советовали покупать акции на фондовых рынках. А сейчас они где? А там же — в прессе, но теперь уже в один голос пророчат рецессию на годы вперёд. И ни в одном глазу хоть чуть-чуть стыда и раскаяния. Не говоря уж о том, что эта свора ельцинских «экономистов» 90-х тоже не чувствует вины и по-прежнему даёт умные советы. А вот где оставшийся 1% — это и есть самое интересное, только их очень трудно распознать. К сожалению, большинство профессиональных экономистов, с которыми мы сталкиваемся — это на самом деле говорящие головы, для озвучивания идеологизированных теорий. Знаете, кстати, как называется по-английски Российская Экономическая Школа, которая сидит в нашем здании и в которой работает Сонин? New Economics School. Как вы считаете, почему такой странный перевод? Мне вот более-менее ясно.

  • Ответить

    2 panchul > Все это было следствием отсутствия культуры частного предпринимательства, и изоляции СССР от мирового рынка Коллеги, при всём уважении. Частное предпринимательство развивается только если есть успешные независимые крупные бизнесы, более того, оно развивается изначально вокруг этих больших бизнесов. Нет независимого крупного бизнеса — не будет и частного. Я бы сказал, что «всё это» было следствием ипотенции руководства страны вкупе с некоторыми особенностями страны как таковой, но никак не следствием неприятия рыночной экономики. Говоря фразы про мировой рынок и законы экономики, не забывайте, что при этом мы выглядим как деревенский дурачок с большими деньгами, которого уговорили сесть поиграть в карты «на интерес» к прожжёным карточным шулерам. 2 Игорь > При этом заметим, что попытка встать на правильный путь в нашей стране привела к полному развалу в течение 20 лет. При этом, вставания на путь, как такового не было. Была попытка перестроить страну, по лозунгам = без понимания того, как реально функционирует экономика в западном рыночном обществе. Фактически, имели место все признаки карго-культа :-) Это в лучшем случае.

  • Ответить

    Альтер 19.01.2009 12:45:22 Это у вас явно какая-то проблема с определениями. Не называйте всякие мелкие шарашкины конторы промышленниками и будет все ок. Насколько я знаю, ни Рамблер, ни Яндекс пейджранк в явном виде не использовали. Просмотрел, кстати, оригинальную статью про HITS, никаких принципиально других опер я там не нашел. С моей точки зрения та же самя идея, что и в PR, только с вариациями. Единственное, что они это все на лету персчитывают относительно запроса, но суть от этого не сильно меняется. Зато нашел много всяких интересных ссылок на доинтернетовские варианты индексов цитирования. Это все настолько не ново, что сдирать какой-то конкретны

  • Ответить

    Я не хотел ничего писать в этой теме, но раз тут уже дошло до сотни комментариев и PageRank’а, то, наверное, уже можно. Отличие HITS от PageRank кардинальное. PR расстанавливает авторитетность документам вне зависимости от тематики, за счёт чего, к примеру, какой-нибудь top100.rambler.ru может запросто стать ответом на все вопросы (потому что ссылок на него очень много). HITS же работает, фактически, только с однотематическими страницами. То есть, если под сутью понимать, что и там и там анализируется ссылочный граф, то да, суть не меняется. Но смысл этих алгоритмов разный, кроме того, они не являются взаимоисключающими. Вообще, если предположить гипотетическую ситуацию, что PR или его аналоги вдруг перестали бы использоваться поисковыми системами, а использовался бы только HITS, то покупка ссылок не имела бы смысла: однотематические сайты ставить ссылки на конкурентов скорее всего не стали бы, а ссылки из других тематик не работали бы. Однако как-то расставить авторитетность страницам перед выполнением запроса всё равно нужно, а здесь PR и его аналоги не особенно хуже других автоматических способов рейтингования.

  • Ответить
    Игорь Ашманов Сам себе компания

    Фактически, имели место все признаки карго-культа :-). Да, верно. Ну и как тогда относиться к жрецам этого карго-культа? А ведь некоторые из них до сих пор не унимаются, пляшут и бьют в бубен.

  • Ответить
    Игорь Ашманов Сам себе компания

    Отличие HITS от PageRank кардинальное. …. HITS же работает, фактически, только с однотематическими страницами Да. Ну и чем сейчас пользуются Яндекс и Гугл? Можно ли с уверенностью утверждать. что у них ПР не тематический?

  • Ответить

    Про «вторичность» всего нашего ит-бизнеса. Ув. господин Сонин видимо плохо с ним знаком. Одна из самых важных компаний для появления российского рынка ИТ — Параграф, создал как минимум пару направлений совершенно пионерских — например рукописный ввод для ньютона (не говоря уже о бизнес модели Пачикова по взиманию денег за просмотр технлогии :) ParaType-у никак не могли бы помочь бизнес-модели битстрима итп, всилу того что в этой стране они не работают. 1С в части бухгалтерии — покажите с кого скопирована бизнес-модель ? Гарант или Консультант. Промт в момент своего возникновения никого не копировал. Ну и т.п.

  • Ответить

    2 Ashmanov > Да, верно. Ну и как тогда относиться к жрецам этого карго-культа? не берусь судить. обидно, что их влияние на нашу жизнь слишком велико, чтобы просто не замечать. > А ведь некоторые из них до сих пор не унимаются, пляшут и бьют в бубен. ага, уже и культ-то при смерти, другой начинается, а они всё в старый бубен колотят.

  • Ответить

    Можно ли с уверенностью утверждать. что у них ПР не тематический? Нет; более того, очевидно что там не одна метрика, а комбинация многих, с весами. И простой PR (вернее, какая-то «мера общей авторитетности») тоже есть, потому что если бы его не было, то вряд ли бы на странице про Русский Апач имелись бы ссылки «пилы и шиномонтажное оборудование». Они бы тогда были бы неэффективными. Ну и банить за такие ссылки тоже не имело бы большого смысла. И я вообще не про Яндекс и Google, а про HITS и PR, которые, в отличие от реальных алгоритмов Яндекса и Google, опубликованы.

  • Ответить

    Отличие HITS от PR все же в том, что HITS присваивает каждой странице два рейтинга, рейтинг авторитетности (authority score) и рейтинг портальности (hub score). Следующим главным отличием является изначальная независимость PageRank от запроса и изначальная зависимость HITS от заапроса, хотя сейчас уже есть модификации как PageRank, зависимого от запроса, так и HITS, независимостго от него. Скатывание к определенной тематике — это не отличие HITS, это один из его недостатков, опять же есть много вариантов борьбы с таким поведением, ровно как и есть варианты тематического PageRank (один из самых известных — вариант, созаднный в Kaltix, эту компанию Google и купил, отсюда же и пошла вся его персонализация).

  • Ответить
    Альтер Эго

    itman ключевая разница между алгоритмами в query-independent vs query-dependent одно дело просто цифра, показывающая качество страницы, а совсем другое цифры, показывающая релевантность (там немного другой показатель, но не важно) для данного конкретного запроса Это как говорят в Одессе «две большие разницы» А как это вычислиятся с двумя скорами или одним это более мелкое вычислительное отличие Принципиальная разницa query-dependent vs query-independent

  • Ответить
    Альтер Эго

    Ашманову а что у вас за такое гениальное место, что все большие головы там сидят? Вы сидите, Донской сидел, Сонин там же сидит

  • Ответить
    Альтер Эго

    derek Тут Ашманов уже упоминал Китай У них достаточно интересная модель развития бизнеса Крупного бизнеса фактически нет, вечь бизнес — множество очень мелких по американским или японским меркам компаний.

  • Ответить
    Игорь Ашманов Сам себе компания

    а что у вас за такое гениальное место, что все большие головы там сидят? Вы сидите, Донской сидел, Сонин там же сидит Обычный академический институт, ЦЭМИ, так называемый «дом с ухом» на м. Профсоюзная в столице нашей Родины. Тут сидит Параграф, сидит Диско (фирма Донского). Мы сидим, сидит РЭШ, школа дизайна и много ещё кого. 20 этажей по 800 кв.м. Ну и сам институт, естественно.

  • Ответить
    Альтер Эго

    Кстати о какой-такой тематике тут говорится? Там вообще все зависит от конкретного запроса купить dvd фильм total recall и купить dvd фильм total recall online произведут разные scores вот такая вот тематика

  • Ответить
    Альтер Эго

    Кстати, про HITS о какой-такой тематике тут говорится? Там вообще все зависит от конкретного запроса купить dvd фильм total recall и купить dvd фильм total recall online произведут для одних и тех же документов разные scores вот такая вот тематика

  • Ответить

    о какой-такой тематике тут говорится? Там вообще все зависит от конкретного запроса Вот как раз тематика, порождённая запросом. Или, вернее, документами, найденными по запросу.

  • Ответить
    Альтер Эго

    Это не называется словом тематика По крайнеем мере в значение этого слова принятом в классическом IR Множество документов это вовсе не «тематика»

  • Ответить

    2 Ashmanov Господин Ашманов, я вот тоже из того здания с ухом и тоже на томже лифте езжу, но вот в отношении Паршева и экономистов не вполне с Вами соглашусь. Конечно, к опыту людей «от сохи» прислушиваться надо, но вряд ли Вы обратитесь к нетрадиционной медицине, когда у Вас болит живот и все признаки аппендицита налицо. Но вот обратиться к нетрадиционной медицине, когда традиционная разводит руками — это будет логично, так как хочется жить и быть здоровым — так тут все средства хороши. Так и в отношении экономики и экономистов. Экономика — не точная наука, она только вышла из точных наук. Это наука социальная. И очень молодая наука. И понята пока только небольшая толика явлений. И вот среди этих понятых явлений — есть и то, что пытается раскритиковать Паршев. И с точки зрения специалиста он делает это очень плохо, так как он этого явления не понимает. Это вообще такая удивительная вещь — принцип сравнительного преимущества, который был открыт Дэвидом Рикардо (если не ошибаюсь около 1870 года). Адам Смит до него не додумал, он про принцип абсолютного преимущества написал. Кстати, удивительный, но очень показательный факт — Смит потрясающе все понял про экономику и рынки — интуиция у него экстраординарная, а вот тут он не додумал. Рикардо спустя несколько лет посчитал несложную арифметику и тогда понял в чем дело и нашел ошибку рассуждений у Смита. И причина ошибки Смита в том, что принцип сравнительного преимущества — он контринтуитивен. Но это не делает его неверным. Надо только один раз посчитать — решить задачку и все становится ясным. Для этого в экономике и нужна математика — чтобы зерна от плевел отделять. Но это я к чему. Вот Вы ссылаетесь на книгу Паршева — а он, будучи неспециалистом, может понять интуитивные вещи, а контритуитивных, к сожалению, нет. Так что можно я Вам посоветую еще одну книгу — уже специалиста и очень признанного — Бхагвати Джагдиш. В защиту глобализации (In Defense of Globalization). Ладомир, 2005. 406 с. ISBN 5-86218-391-4 Я думаю, если эту книгу внимательно прочитать (лучше, конечно, на английском, тонкости перевода, сами знаете), то все ошибки Паршева станут налицо. Успехов!

  • Ответить

    Игорь, я не могу согласиться, что у каждой страны должна быть своя специфика, однако не могу не отметить, что в отношении Китая работал тот же принцип, что и в США: был огромные рынок сбыта. Недавно даже термин такой придумал chimerica. Китая рос на иностранных инвестициях и практически неограниченных возможностя сбыта. В Советстком Союзе этот принцип не работал ну никак. Alkalinin: в HITS не совсем тематика запроса. В оригинальной статье авторы предлагают выбирать множество документов, релевантных запросу, расширять его за счет окрестности документов, которые получаются при переходе по гиперссылкам. А уже потом, фактически рассчитывать взвешенный индекс. Так вот, в такой модели ссылки совершенно точно рулят.

  • Ответить
    Альтер Эго

    itman HITSподобные алгоритмы очень нестабильны (в метриках по document score) по отношению к инкрементальным изменениям в запросах

  • Ответить

    Альтер, я себе сейчас очень живо представил последовательность запросов, сходящихся к искомому. А также верхнюю и нижнюю грань значения HITS на этой последовательности.

  • Ответить
    Альтер Эго

    Хорошее воображение )))) вроде только в HITS по википедии ознакомился, а уже как воображение разыгралось

  • Ответить

    Альтер, вы делаете несколько фундаментальных ошибок. Во-первых, вы предполагает, что я знаком с HITS только по википедии. Во-вторых, вы непонятно зачем зацикливаетесь на разнице между двумя алгоритмами (хотя принципиальность это разницы — это дело вкуса), и начисто забываете, что есть действительно очень принципиально отличные методы, которые ссылочную структуру напрочь не используют. В-третьих, мне мама говорила, что нужно быть умным и приятным человеком. Но лично я рекомендую быть приятным. Удачи вам и побольше терпения в общении с вашими «промышленниками».

  • Ответить
    Альтер Эго

    itman Спасибо, что пришли к тому, о чем я говорил с самого начала. Есть вариации ссылочных алгоритмов, которые в российских системах не использовались до того, как стали популярными и опробованными на западе. Все эти вариации всего лишь вариации и есть гораздо более отличные (в смысле different, а не excellent) от семейства pagerank методы. Желаю Вам успехов.

  • Ответить

    Ответ derek: *** Коллеги, при всём уважении. Частное предпринимательство развивается только если есть успешные независимые крупные бизнесы, более того, оно развивается изначально вокруг этих больших бизнесов. Нет независимого крупного бизнеса — не будет и частного. *** Абсолютно согласен. Развитая экономика — это винегрет из больших контор, частных инвесторов, университетских исследователей. Большие конторы необходимы для поддержания статуса-кво, малые конторы иногда полезны для инноваций и т.д. В этом винегрете постоянно происходят процессы поглощения малых контор большими, роста больших контор из малых, вымирания направлений и т.д. Я работал в нескольких больших конторах (Creative Labs, Mentor Graphics, Synopsys), был основателем малой конторы (получал при этом инвестиции от Интела и венчурных капиталистов), так что я имел возможность наблюдать данный механизм в разных ипостасях. *** Говоря фразы про мировой рынок и законы экономики, не забывайте, что при этом мы выглядим как деревенский дурачок с большими деньгами, которого уговорили сесть поиграть в карты «на интерес» к прожжёным карточным шулерам. *** ИМХО одним из выходов из ситуации была бы плотная интеграция разнообразными способами — аутсорсингом, привлечением западных компаний в Россию и т.д. Еще в 1996 году я помог своему московскому знакомому (который сейчас умер от рака) получить контракт для его маленькой конторы (которая находилась при МФТИ) на писание софтверных моделей хардверных устройств. Заказчиком была крупная американская компания Mentor Graphics. Они написали верификационные модели Hitachi SH и многие другие, за 10 лет получили от американской компании пару миллионов долларов, и при этом научили кучу людей (в конторе было N студентов или бывших студентов МФТИ). Хоть это довольно мелкий пример, но если бы таких начинаний было бы много, то Россия бы постепенно интегрировалась в международный рынок. Сейчас на выставках типа Design Automation Conference Россия практически не представлена, хотя компании из Америки-Европы-Азии все представлены, кооперируются друг с другом и т.д. На самом деле «шулерства» на этом рынке мало. Если у компании интересный продукт, то получить для него прессу, внимание инвесторов и клиентов не так сложно. (Когда я был CTO и наша компания состояла из трех человек, мы получили статью на первую страницу от Electronic Engineering Times, и эвалюацию продукта от Hitachi и Fujitsu (японские компании проверяют все, что появляется на рынке). Поэтому ИМХО внимание российских хайтек-бизнесов должно быть направлено не на страхи «у них все схвачено», а на то, чтобы 1). интегрироваться 2). предлагать Новую технологию (на западе абсолютно никому не нужен «чуть-чуть» лучше аналог MS Word от неизвестной компании, но принципиально новая идея может привлечь и корпоративных и венчурных инвесторов). *** При этом, вставания на путь, как такового не было. Была попытка перестроить страну, по лозунгам = без понимания того, как реально функционирует экономика в западном рыночном обществе. Фактически, имели место все признаки карго-культа :-) Это в лучшем случае. *** 100% согласен. В России насколько я вижу со стороны, куча карго-культа. Еще в 1990-е начали внедрять ISO 9000 (на фиг он нужен при неразвитой экономике), а вот фундаментально важные вещи (например венчурные капиталисты) стали появляться только в последние годы.

  • Ответить
    Альтер Эго

    Юрий Панчул Вы всегда очень интересно рассказываете кем Вы работали раньше А кем Вы работаете и чем занимаетесь сейчас?

  • Ответить

    То Alter Ego: Сейчас я занимаюсь тем же, чем и в Mentor Graphics — т.е. верификационными моделями устройств, работая в Denali Software. Это не так интересно, как было с компиляторами и с своей компанией, но по крайней мере мои текущие продукты использует Intel, Apple и некоторые другие конторы для дизайна устройств типа сотовых телефонов, игровых приставок и т.д.

  • Ответить

    Насчет продвижения наших компаний и продуктов «у них». Беда в том, что у нас хороший программист (программисты) пишут неплохой софт (иногда вообще уникальный), но … это только код, это не продукт для рынка. Т.е. наши компании это только половинка нормальной компании — только отдел разработки. Весь back office, логистику, продажи, маркетинг — многие программисты считают «развратом» и осуждают MS за активное использование этих вещей. Увы, но на рынке нужно продавать продукты, а не «глазки». ИМХО, чтобы успешно развивать ИТ у нас фатально не хватает именно специалистов по рынку. Они есть в западных компаниях (где их услуги понимают и платят соответственно). Чем плодить Местечковую (Национальную) ОС, лучше бы дали разработчикам денег для покупки этих специалистов для выхода на их рынок. А продукты у нас еще есть хорошие…

  • Ответить
    Альтер Эго

    лучше бы дали разработчикам денег для покупки этих специалистов для выхода на их рынок У кого денег просите? У Юрия?

  • Ответить

    Да у меня своих много )) Вот была хорошая программа, когда государство предложили инвестиционным фондам дать доллар на каждый доллар вложенный инвестфондом. Это было разумно. Государство плохо умеет управлять венчурным капиталом, поэтому оно идет с профессиональным фондом и удваивает его капитал, за половинную долю в бизнесе. По-моему умно…

  • Ответить
    Альтер Эго

    Вопрос Ашманову Какоя размер индекса (допустим, число уникальных страниц) нужен для поисковика по рунету и необходимой части иностранного интернета, чтобы его сделать приемлимым по качеству (структура пространство запросов, пропорции навигационных, фактических и др запросов предполагаем такими же как у больших поисковиков вроде Google и Яндекса-Рамблера) для русскоязычной аудитории? Как размер индекса будет зависеть от требований к качеству выдачи (для разных определений «качества», какие вы сами посчитаете нужным выбрать в зависимости от их важности) Допустим мы ограничены 2^32 страниц. Какие страницы должен отбирать робот и как само-учиться, чтобы в этот индекс обеспечивал максимальное возможное качество выдачи (предполагая, scoring компонент поисковика уже разработанным А) идеальным (абстрактно) Б) неплохим для русского, сравнимым с Google 2000 года для английского языка )

  • Ответить
    Альтер Эго

    Будет интересно выслушать также мнения других людей Интересует ответ на вопрос, интересные рассуждения и оценки, а не белиберда вроде «не стоит пытаться тягаться с гигантами», «а вам зачем», и прочая ерунда

  • Ответить
    Игорь Ашманов Сам себе компания

    Два в тридцать второй страниц — это примерно 5 миллиардов. Маловато даже для Рунета. После этого все остальные вопросы не имеют смысла. Нужно переформулировать задачу.

  • Ответить
    Альтер Эго

    Что значит «маловато для рунета»? Вы же отлично понимаете, что все за пределами 5 миллиардов, а скорее всего даже за пределами 500 000 миллионов, это то, что запрашивается на 20 процентов наименее популярных уникальных запросов, вроде личное имя, где купить какой-то редкий товар и пр. За пределами 5 млрд это скорее всего процентов 5 наиболее редких запросов. Это то, что запрашивается. Если вы же рассмотрите то, что интересно случайной выборке из 30 млн пользователей, то скорее всего 5 млд будет более, чем достаточно, вопрос в том как эти 5 млрд правильно получить Другой вопрос Вы правы, 5 млрд МАЛО. Сколько достаточно? А если 5 млрд, то насколько хорошо. Сколько в идеале precission вы проиграете. И будет ли это заметно пользователям. Вот по вашим метрикам (вы называете это recall) индекс гугла заметно больше индекса Яндекса. Это заметно по вашим меркам, по специально отобранным запросам с редкими словами. ЗАметно ли это пользователям Гугла — Яндекса? Опять же 5 млрд, если мы проигрываем в recall, то в чем мы можем выиграть, чтобы тем не менее сделать систему привлекательной для пользователя. Например, вместо 50 млрд всех подряд документов без особого умения индексировать свежие документы (как у «гигантов рунета», можете написать какой-нибудь уникальный текст в ЖЖ, и посмотреть когда он появится у гигантов, ждите неделю) , мы можем отдать 4 млрд «качественным документам» независимо от возраста и посвятить 1 млрд индексу для свежих документов, активно индексируя сайты, которые часто обновляются (новости, блоги) и отдавая в главный индекс поисковика вместо всяких побочных сервисов. Выиграем ли мы от этого или хотя бы не потеряем?

  • Ответить
    Альтер Эго

    Мне понравилось про «5млрд — маловато будет!» Я помню как в стародавние времена я укладывал в 256К вычисления, про которые другие программисты говорили «1М? маловато будет, надо extended memory пользоваться»

  • Ответить
    Игорь Ашманов Сам себе компания

    Мало — это значит мало. Если уважаемый Альтерэга пишет, что унего есть 2^32 страниц, а в Рунете их, скажем, 20 миллиардов, то пяти миллиардов — мало. Разговоры о том, что при Сталине всё было по-другому, небо голубее, вода мокрее, а женщины моложе, и что вы запихивали мегабайт в 256К, а косинус доходил по ночам и до четырёх, не помогут вам запихнуть 20 миллиардов в адресное пространство двух в тридцать второй. Что-то придется-таки не индексировать. И на замечательный вопрос, как изменится precision, если полноты индекса не хватает, я ответить не могу.

  • Ответить

    Здесь вопрос не в числе документов (Ашманову: 2^32 это не 5 млрд., это чуть менее 4.3 млрд), а в том, что есть «приемлимое качество». Наприер, используя одну машину и проиндексировав чуть менее 2 млн. заглавных страниц сайтов Рунета можно получить поисковик, который в тестах навигационного и тематического поиска analyzethis.ru будетпревосходить поисковики Yahoo и Aport, и поисковик Рамблера в тематическом поиске (собственно это и ответ, почему падает рамблер — слабый поиск по более, чем по одному слову, и более ничего): http://s.sochi.org.ru/grow.shtml#nav http://s.sochi.org.ru/grow.shtml#theme

  • Ответить
    Альтер Эго

    Как-то у меня сомнения насчет тематического поиска в олимпийской столице страны. Среди частотных двухсловников ну разве только «бесплатное порно» дало ответ, близкий к ожидаемому. Сами то каким поиском пользуетесь в реальной жизни?

  • Ответить
    Альтер Эго

    А может и логи профукиваются? У вас не показывается время в выдаче, посему скриншот не поможет, отчего мои слова против ваших — неинтересно. Второй вопрос остался неотвеченным — сами то каким поисковиком пользуетесь?

  • Ответить

    Пардон, нашел ваши запросы :) «хуй», «настроить mysql», «libraw», «переводчик онлайн», «бесплатное порно», «анальное порно» — они ? Если не считать 43n39e, то самое частое Гуглём, далее Яндекс, Яху, Лайв, Нигма, Рамблер. Остальные по мелочи эпизодически. А у вас какие предпочтения к поисковикам ?

  • Ответить
    Альтер Эго

    Альтре эга пишуший вопросы поиск по пунктуации похож на тренслейт.ру. ))) Сам Брин или Пейдж похоже с Ашмановым общается. Собеседование устраивают таким образом, не иначе.

  • Ответить
    Игорь Ашманов Сам себе компания

    >>Два в тридцать второй страниц — это примерно 5 миллиардов. Маловато даже для Рунета. // Ашманов > Ашманову: 2^32 это не 5 млрд., это чуть менее 4.3 млрд //Захаров. Максим, я считаю в уме, даю примерную оценку сверху и говорю — этого мало. Вы считаете на калькуляторе и указываете мне на как бы ошибку. Ну и зачем вы это делаете? Чего вам неймётся?

  • Ответить
    Игорь Ашманов Сам себе компания

    Здесь вопрос не в числе документов …, а в том, что есть «приемлимое качество». Например, используя одну машину и проиндексировав чуть менее 2 млн. заглавных страниц сайтов Рунета можно получить поисковик, который в тестах навигационного и тематического поиска analyzethis.ru будетпревосходить поисковики Yahoo и Aport, и поисковик Рамблера Откуда известно, что вопрос не в числе документов? Качество на небольших выборках можно померить. И что оно покажет? Более того, можно получить высокое качество, имея поисковик вообще по 5000 или 50 000 сайтов/страниц. Просто взять, выкачать по возможности наши запросы-маркеры, все ответы на них всех поисковиков, добавить ещё каталог Яндекса, да и хватит. Мы, кстати, только что удалили из рейтинга Янгу ровно за это — за специальную настройку на наши маркеры. Но откуда известно, что подумает пользователь про поисковик с малой базой, но хорошим качеством? Ведь мы в analyzethis.ru сравниваем между собой поисковики с большими базами. Это по сути заданное условие, практически равное для всех. Может, при маленькой базе пользователи не будут пользоваться даже при высоком качестве поиска? В частности , в пользу этого соображения говорит тот известный факт, что больше половины поисковых запросов — уникальны, не повторяются от месяца к месяцу. Хвост там длинный и тяжёлый. Если твой поисковик его не покрыл, пользователи могут не захотеть пользоваться. Собственно это и ответ, почему падает рамблер — слабый поиск по более, чем по одному слову, и более ничего): Я думаю, падает он не поэтому. Это надуманное объяснение. Причины там проще и с качеством поиска прямо не связаны.

  • Ответить

    Ашманов, оценка в 5 млрд. звучит также как 2х2=5, на комеди клабе прикольно, на уроке программирования — наоборот… Откуда известно, что вопрос не в числе документов? Потому что, перед тем, как что-то конретно мерить, хватит того, или нет, нужно определиться, а что есть «хватит»… Собственно в этом и есть вопрос, что есть «приемлимое качество», вы так на это и не ответили. Более того, можно получить высокое качество, имея поисковик вообще по 5000 или 50 000 сайтов/страниц. Получите и продемонстрируйте, пожалуйста, по 5000 страниц. (Это просто намек, что у вас не получится, вы просто не пробовали, потому только гадаете). Вы немного переоцениваете свой analyzethis, утверждая, что он одинаков для всех. Создав сервис, за ним следить надо, я уже писал в своем блоге, что часть ваших маркеров закрыли свои сайты от индексирования всеми кроме Гугля и Яндекса — ни о каком «одинаковом для всех» уже речи нет. Также не отслеживаются переезды сайтов маркеров и появление зеркал на новых доменах. Я думаю, падает он не поэтому. Это надуманное объяснение. Причины там проще и с качеством поиска прямо не связаны. Вы здесь столь же туманны, как чревовещатель средневекового цирка :) Пытаетесь показать, что что-то знаете, но боитесь это сказать из-за опасения оказаться неправым (что ударит по кошельку). По вашему аналайзу видно, что рамблер очешь плох в тематическом поиске, до исправления этого положения, говорить об остальном, — ну можно, только смысла нет. И это пример большой базы с плохим качеством…

  • Ответить
    Альтер Эго

    Я не вижу никаких разумных причин, что 5 млрд это мало Да. у некоторых поисковиков гораздо больше Но это больше, это бесчисленные дубликаты с которыми они не умеют справляться и всякие страницы плохого качества Возьмите какой-нибудь форум Один тот же thread может быть представлен 1000 страниц. По странице для каждого сообщения, по странице для каждого поддерева. Все эти страницы нужны если эта нитка форума полезна для какого-либо запроса? Сомневаюсь. Эти страницы не являются прямыми дубликатами друг друга, но тем е менее избыточность огромная.

  • Ответить
    Альтер Эго

    Мы, кстати, только что удалили из рейтинга Янгу ровно за это — за специальную настройку на наши маркеры. А только ли Янгу? Я помню как гораздо большие поисковик рунета совершали резкий прыжок вперед по Ашмановским метрикам когда им срочно надо было догнать тот же гугл, но в качестве выдаче как пользователь, я никакого особого скачка не ощущал.

  • Ответить
    Игорь Ашманов Сам себе компания

    Вы здесь столь же туманны, как чревовещатель средневекового цирка :) Пытаетесь показать, что что-то знаете, но боитесь это сказать из-за опасения оказаться неправым (что ударит по кошельку). Я не так уж туманен. Для тех, кто этим интересуется, здесь на Роеме была нитка обсуждений, где это обсуждалось. Если вы не читали ил и не слышали — это ваша проблема. Почему падает Рамблер, в общем, известно, это не бином Ньютона. Качество любимого вами тематического поиска тут не очень при чём. И вы вообще определитесь — то ли у нас плохие анализаторы, то ли им можно доверять и тогда уже делать вывод о плохом качестве тематического поиска Рамблера. А уж как может ударить по кошельку, если я скажу что-то тут не то на Роем.ру про качество поиска — вообще ума не приложу. По-моему, у вас там в вашей сочинской башне из слоновой кости завелись внутренние демоны. Получите и продемонстрируйте, пожалуйста, по 5000 страниц. (Это просто намек, что у вас не получится, вы просто не пробовали, потому только гадаете … Максим, ну вот что вы со мной всё время пытаетесь бороться? Что вам там не сидится? Ну вот откуда вы знаете, что «мы не пытались»? Свой поисковик у нас свой есть, неужели вы думаете, что мы не индексируем время от времени то тут, то там. Сходите на Флексум, там 50 000 сайтов заиндексировано этим поисковиком, поюзайте там бету Поиска поисков, он называется пока «Поиск по каталогу». Сходите на Нейрон, там тоже много тысяч сайтов заиндексировано. У нас есть клиенты с нашим поиском, типа AllExpo и ММВБ, с тематическим поиском по тысячам сайтов. Я уж не говорю, что в течение полутора лет в Рамблере мы тоже много чего «пробовали», например, индексировать все сайты в Тор100. Я, в отличие от вас, пробовал и представляю задачу построения большого конкурентоспособного поиска. Но это всё у вас чисто эмоциональное и не имеет отношения к основному вопросу: Если база поисковика меньше на порядок, а качество лучше всех — будут ли его использовать? Мой ответ — скорее всего, нет. Есть и пример из жизни: ровно в этой ситуации был Апорт в 1999-2003 годах. У него было отличное качество, лучше Яндекса и Рамблера, а сравнимый с ними объём базы они не асилили. Результат налицо.

  • Ответить
    Игорь Ашманов Сам себе компания

    А только ли Янгу? Мы довольно долго и внимательно наблюдаем за поведением поисковика при смене набора маркеров, прежде чем сделать выводы. Бывает естественный рост качества, а бывает накрутка. Накрутку мы видим.

  • Ответить

    Если вы не читали ил и не слышали — это ваша проблема. А истерику-то зачем закатывать, вполне мог и не читать… Можно было бы просто сказать, а не наводить тень на плетень. Максим, ну вот что вы со мной всё время пытаетесь бороться? Что вам там не сидится? Ну вот откуда вы знаете, что «мы не пытались»? Не льстите, себе, если кто-то с вами дискутирует, то не обязательно он с вами борется, и если кто-то за вами идет, то вовсе не обязательно он вас преследует… Впрочем за вами могут следить :) У вас не менее 1750 различных сайтов-маркеров в тестах навигационного и тематического поиска, значительная их часть использует редиректы и фреймы, кто-то закрыл сам себя в robots.txt, кто-то не содержит слов запросов — без индексирования вглубь и ссылок с других сайтов не обойтись (в среднем на странице в порядке десятка ссылок) — итого в 5000 вы никак не уложитесь, особенно, если захотите показать результат выше 50% в навигационном. Сходите на Флексум, там 50 000 сайтов заиндексировано этим поисковиком, поюзайте там бету Поиска поисков, он называется пока «Поиск по каталогу». Был я там уже, или вы меня за чем-то конкретным послали, но забыли написать ? Вы-то его в своем аналайзе тестировали ? Можно результаты, если да. Я уж не говорю, что в течение полутора лет в Рамблере мы тоже много чего «пробовали», например, индексировать все сайты в Тор100. Ну и? это не достижение, там всего в районе 10% сайтов Рунета описано, со значительной толикой фейковых сайтов. Есть и пример из жизни: ровно в этой ситуации был Апорт в 1999-2003 годах. У него было отличное качество, лучше Яндекса и Рамблера, а сравнимый с ними объём базы они не асилили. Результат налицо. Судя по аналайзу, поиск Апорта явный швах — легенда о его лучшести как-то не подтверждается.

  • Ответить
    Игорь Ашманов Сам себе компания

    Максим, вы против чего согласны-то? С чем спорите? Вы зачем-то привязываетесь к каким-то мелочам, типа подсчёта на калькуляторе, сколько будет два в 32 степени, чтобы с торжеством объявить, сколько это будет в граммах. Причём и с мелочей тут же соскакиваете, стоит указать на неуместность или лажу. У вас по существу-то что есть сказать? Напомню, вопрос был — можно ли выиграть конкурентную гонку с большими поисковиками, имея маленький, но умный поисковик. А вы, как обычно, начинаете метаться из стороны в сторону и постоянно меняете предмет. Что касается Апорта, то «легенды» я не слышал. А мы в Рамблере просто замеряли качество Яндекса, Рамблера и Апорта в 1999-2001 годах, когда мы разрабатывали новый поиск Рамблера. Примерно такими же анализаторами. Тогда Апорт был безусловно лучшим по качеству, а по размеру базы уже начинал отставать. В Апорте было множестве инновационных фишек, которых не было ни у кого. В частности, Апорт начал первым применять ссылочное ранжирование, раньше всех в Рунете, да и раньше Гугла, насколько я понимаю. То, что спустя семь лет на голодном пайке, после последовательного ухода двух команд разработчиков, он сейчаспоказывает плохое качество — неудивительно.

  • Ответить
    Альтер Эго

    Максим я не понимаю о чем Вы спорите с Ашмановым Ашманов абсолютно прав, Вы можете создать очень неплохой поисковик в какой-то конкретной области используя совершенно небольшой индекс. Это называется focused crawling и эта тема была крайне популярна в академическом сообществе начиная с конца 90х, когда размер веба резко вырос и узкотематический поисков не мог позволить себе больше обходить большой веб и до 2003-2005 когда все темы были более-менее исчерпаны. До 2000 года было проделано много работы, на наиболее интересная часть начинается с 2000 (не помню точно может 2001) года со статьи Дилиженти в VLDB о focused crawling при помощи контекстных графов (этот метод потом использовался почти всеми). Кстати, тема весьма интересная. Если вы хотите создать crawler который будет индесировать только нужные вам страницы, и будет разыскивать их по всему вебу, а не только с указанных вами сайтов (как сейчас делают custom search engines от google, yahoo, и др) , вам нужно решить как находить нужные тематические страницы если они отделены от ваших многими нетематическими переходами (вы создаете сайт по недвижимости, вы хотите собрать все объявления о продаже домов, у вас могут появиться линки на заголовки газет, но вы должны уметь добраться до разделов о недвижимости проходя нерелеватные части как можно меньше) Потом даже научились как оценивать такие алгоритмы, так как их накопилось разных очень много Srinivasan в 2005 году научился их оценивать, он также дал обзор многим таким алгоритмам накопленным на тот день Тема, кстати, весьма интересная и горячая. Все современные *ЗАПАДНЫЕ* индексы по тематике, поиск по блогам, основаны на автоматическом поиске нужных тем и типов страниц, а не на подсовывании правильных url людьми и программистами. Не знаю умеет ли кто-то в России это делать, про это может рассказать, наверное, Ашманов Ашманову. Вы говорите, что Вы замечаете когда кто-то старается подкрутить свой алгоритм под ваши метрики. Вы видимо имеете ввиду прямое подкручиванье. А если они просто используют ваши данные, как training sets для своих machine learning алгоритмов. Вы знаете как это отличить от настоящего роста по вашей метрике не спровоцированного тщательного подогнанными training sets? Кстати, в последнее время многие системы поразительно похожи друг на друга Я могу понять почему набрав microsoft Вы видите вверху одни и теже головные англо и русско язычные страницы, почему вы видите популярную страницу IExplorer и downloads для Windows Но почему остальные результаты в выдачах так изумительно похожи Вы не пытались сравнивать систему между собой, учитывая временные лаги, когда одна может стать очень похожа на другую?

  • Ответить
    Альтер Эго

    О каком ссылочном ранжирование Вы говорите Вы говорите об алгоритме типа PageRank со стох матрицей или просто использовании текстов в ссылках? Текст в ссылках используется по меньшей мере с 1994 в World Wide Web Worm разработанном в университе Колорадо, это докладывалось на первом WWW форуме и было бы странно если бы разработчики Аппорта про это не знали

  • Ответить

    Ашманову, Напомню, вопрос был — можно ли выиграть конкурентную гонку с большими поисковиками, имея маленький, но умный поисковик. Фигасе, а подняться чуть выше и перечитать? Было же Какоя размер индекса (допустим, число уникальных страниц) нужен для поисковика по рунету и необходимой части иностранного интернета, чтобы его сделать приемлимым по качеству (структура пространство запросов, пропорции навигационных, фактических и др запросов предполагаем такими же как у больших поисковиков вроде Google и Яндекса-Рамблера) для русскоязычной аудитории? Ваш ответ — «не менее 5 млрд.», мой — «что есть приемлимое качество ?» — Все остальное — ваши попытки показать, кто здесь самый умный. А пример с 2^32 — эт пример насколько точны ваши оценки… В частности, Апорт начал первым применять ссылочное ранжирование, раньше всех в Рунете, да и раньше Гугла, насколько я понимаю. На сайте Апорте сейчас написано, что они используют вариант PageRank, а поскольку Гугл родился с PageRank, то сомнительно, что Апорт его придумал раньше. Скорее они использовали текст под ссылками, но никак не граф ссылок. АльтеруЭго, Ашманов абсолютно прав, Вы можете создать очень неплохой поисковик в какой-то конкретной области используя совершенно небольшой индекс. Вообще-то вы первый, кто об этом заговорил…

  • Ответить
    Игорь Ашманов Сам себе компания

    Вы извините, по-моему, это всё чушь. Вы задаёте гору некорректных вопросов, растолковывать некорректность каждого из которых нужно на пяти страницах. Вы даже слово «приемлемый» упорно пишете неправильно; вы не понимаете, что такое качество, путаете его с количеством, но требуете ответов. Случай с двойкой в 32 степени — действительно очень показательный. Я сказал вам, посмотрев в потолок и прикинув в уме, что 2 в 32-й — это примерно 5 миллиардов, а нужно-то 20. А Максим Захаров из Сочей страшно обрадовался, полез в калькулятор и ужесточил мою верхнюю оценку вашего адресного пространства до 4,3 миллиарда. Да, 4,3 миллиарда — это ещё меньше, понятно, что это означает относительно вашего вопроса? Вы спрашиваете, какой размер индекса нужен для поисковика по Рунету? Я скажу вам — адресное пространство в индексе не должно быть меньше 20-20 миллиардов страниц. А лучше 100 миллиардов. Пока число страниц в Рунете меньше, но оно быстро растёт, и ограничение разрушит проект. Я задал гораздо более важный вопрос — какова конкурентноспособность поисковика с маленькой базой. Это важно — чувствителен ли массовый полдьзователь к кардинальным различиям в размере индекса. Величина хвоста уникальных запросов даёт тут пищу для размышлений. Но вы, похоже, не понимаете. Возможно, вы создатель ещё одного проекта «не хуже Яндекса» на небольшие инвесторские деньги, отсюда и это странное ограничение. Ну тогда вы повторите судьбу Вебальты. Либо вы думаете, что это можно сделать на готовом открытом поисковике, у которого в архитектуру зашито такое ограничение. Это ещё безнадёжнее.

  • Ответить
    Игорь Ашманов Сам себе компания

    А, прошу прощения, не увидел ник. Это как раз вы, Максим, и пишете. Ещё раз повторю: главный вопрос — чувствительны ли массовые пользователи к маленькой базе. Если есть много уникальных и редких запросов, а есть данные, что их больше 50%, то тогда маленький поисковик обречён на поражение. Ладно. Это тема не для этого топика, тем более тут началась демонстрация эго и больше ничего. Миша Донской был моим другом и я уже устал каждый день несколько раз получать письма с темой о том, что он умер. Я и так это помню. В общем, я отписываюсь от присылки комментов и дальше отвечать здесь не хочу.

  • Ответить

    Ну что ж, поставлю и я точку. Игорь, заниаясь программированием, доставать калькулятор для оценки 2^32 не нужно, то уже зашито в подкорку, поэтому ваша оценка в 5 млрд. и вызвала удивление… Дался вам этот хвост запросов, это не более как побытка ввернуть умные словечки, — ведь хорошо известно, что все выстрелившые поисковики брали качеством, а не количеством (Альтависта и Гугол, ну и Яндекс в Рунете), все невыстрелившие, но собравшие большую базу, нежели лидеры, (AlltheWeb и Cuil) — не дали качества, лучшего, чем у лидеров и ушли в небытье. Поэтому размер — не особо имеет значение, качество первично. Что касается зашитого ограничения — оно наложено на одну поискову ноду (а нод может быть несколько), во-вторых снимается простой перекомпиляцией с другим типом, да за счет потери совместимости с уже накопленной базой, но это не смертельое ограничение. Ну и в завершение, я не поисковик строю, я движок этот разрабатываю, и не знать вам это, как специалисту в поиске… я уже давно вам намекаю, что вы очень категорично и предвзято судите о вещах, о которых имеете весьма смутное предствавление.

  • Ответить
    Альтер Эго

    Ашманову — давно пора. Пытаясь спорить с дураком , Вы опускаетесь до его уровня, где он Вас задавит своим опытом.

  • Ответить
    Альтер Эго

    Максим мне кажется Вы должны извиниться перед Ашмановым Вовсе не нужна такая грубость при обсуждении технических вопросов Я думаю маловероятно, что кто-то придумал алгоритм подобный PR в Аппорте Подумайте сами PageRank давал огромный скачок в качестве выдачи по тем временам. IR функции были сравнительно простые. Веб был сравнительно маленьким и не требовал таких датацентров. Если бы в Апорте придумали такой алгоритм и увидели резкий скачок на русском вебе, было бы большим грехом не попробовать на английском вебе. Человек, которому в голову пришла эта идея был бы милиардером вместо Брина и Пейджа, и не сидел бы в скучном офисе на Профсоюзной или Самокатной, а проводил свое время между своим островом на Тихом океане и Давоским форумом.

  • Ответить
    Альтер Эго

    У Апорта и так было отличное качество. Вообще это иллюзия, что Гугл выиграл из-за качества. Точнее, хорошо распиаренная корпоративная легенда. Просто в 1998-99 годах в России не было (и сейчас не) такого механизма перевода алгоритмов в деньги, как в Калифорнии. И покруче вещи здесь делались, чем поисковик по Рунету, например Тетрис, захвативший мир за полгода. Ну и где тот миллиардер Пажитнов?

  • Ответить

    Качество в успехе проекта почти всегда не на 1 месте, но естественно оно важно. —- А Пажитнов и ко это середина 80’ых (для появления кооперативов и т.п.), Тетрис продал еще ВЦ АН за довольно большие деньги, слышал про цифры в диапазоне 5-10 млн $ (обычно говорят про 6), это очень долго (больше 10-15 лет) был крупнейший случай продажи софта на территории СССР. Авторам обещали что-то на уровне компьютеров (и вроде не получили), а деньги много лет делил совет трудового коллектива на всех… Ну а сам Пажитнов себя нашел, много где работал, в том числе и в MS, на нормальных позициях

  • Ответить
    Альтер Эго

    Так Вы бы эту историю поизучали что ли. Посмотрели бы кино по ссылке. Пажитнов ничего не мог продать. Пажитнову ВЦ даже премию не выплатил за изобретение тетриса. Государство советское, действительно, сделало на тетрисе несколько миллионов долларов, но автору заплатило шиш. Пажитнов начал получать кое-какие отчисления после, кажется, 96-го, когда старый договор на распространение Тетриса истек, а новый был заключен непосредственно с Пожитновым, но это копейки, а не миллионы.

  • Ответить
    Альтер Эго

    Эта история к теме относится, Пажитнов был фактически из той же тусовки, того же поколения, что и Донской. Реальная история продажи — 6 миллионов долларов, их себе забрал ВЦ РАН, Пажитнов получил премию, какую — неизвестно. На сотрудников ВЦ АН выделили 2 миллиона и раздали их в виде бытовой техники и компьютеров в 1992 году. Выдавали по 50 долларов за год стажа. Потом Пажитнов вроде договорился с какими-то японцами, которые принялись отспаривать его права, а Тетрис уже широко разошелся, игр наделали десятки. Дальше организовал Аниматек, но неудачно, заработки были не очень, потом трагически погиб директор фирмы, Пажитнов ушел в МС.

  • Ответить
    Альтер Эго

    Понравилось тетрис «круче», чем поисковик по рунету А чем круче? Я не вижу там никаких технических проблем Или баблом круче? Так и на приставке Дэнди в 1995 заработали 100 млн долларов Яндекс-Рамблер только в этом году на такой рубеж вышли Вы же не будете говорить, что Дэнди «круче» поисковика по рунету

  • Ответить
    Альтер Эго

    >>>тетрис «круче», чем поисковик по рунету. А чем круче? <<< Чем по рунету. Вы попробуйте написать игру, чтобы через полгода в нее играл весь мир, а через пять лет она была в любом мобильнике, игровой приставке и игровом автомате на вокзале. Тогда поговорим, что круче. Еще попробуйте написать какую-нибудь поэму или повесть, чтобы ее читали миллионы людей через 2000 лет. Ладно, пусть 200. Или хотя бы через 20. Тогда поговорим, что такое "круче".