>из 200 000 уголовных дел на предпринимателей до суда дошли 30 000
Ну так это же естественная статистика для нашего законодательства, специально заточенного на воровство западными пейсателями законов.
Уголовное делопроизводство длится достаточно долго, потому что никто особо сотрудничать со следствием не будет. В то же время закрытие ООО (например «слиянием») происходит гораздо быстрее, максимум за пол года, часто раньше. После того, как ОГРН напрочь пропал из реестров, в суд подавать уже нет смысла, не с кем судиться. Ну а документы на закрытие обычно подаются сразу же по возбуждению уголовного дела или даже раньше, после первого визита органов.
Там есть ещё и другой вывод из цифр, который любят всёпропальщики — закрывается большое число бизнесов, а новые не открываются, т.е. задушили крававые. Это потому, что большинство этих бизнесов было «помойками» или «белыми прокладками», временными фирмами для схем ухода от налогов. Директора там совсем не бизнесмены и после первого вызова на допрос открывать на себя новую фирму обычно уже не хотят. Поэтому на бумаге получается некая печальная для бизнеса картина, которой в реале конечно же нет.
В 2015-2016 должно быть очень большое сокращение кол-ва работающих ООО из-за введения новых правил учёта НДС. Схемы с «помойками» больше не работают, т.к. НДС в таких случаях уже не доказать, его же не было и теперь это сразу видно. В теории всё должно было закрыться ещё летом 2015-го, но из-за инерционности бизнеса (точнее — из-за тупорылости), который надеялся на что-то типа «всё равно ко всем не придут, меня-то точно не найдут в этой бигдате», закрылось не много, всё продолжится в этом году. И опять будут крики про умирающий бизнес, который умирать не особо спешит.
Игорь Ашманов, я про Орфо спорить не хочу, мне Орфо нравится. Докопался я до двух моментов: во-первых, вы отранжировали морфологии в поисках начала века, и это ранжирование ниоткуда не следует. Даже если у вас была самая лучшая морфология, то мало ли, как вы там её прикрутили к Рамблеру? Может быть криво, или вообще не правильно. Ну и публичных тестов не было. А, во-вторых, вы заявили, что морфология для поиска не важна, что очевидно не верно. Для тек, кто не в теме можно так пояснить: если убрать из Крибрума морфологию, то для поиска новых постов в бложеках по слову [ашманов] он не найдет вариантов с [ашманова] и [ашмановым]. Т.е. какая-то морфология должна в поиске быть. Другое дело — на сколько её качество влияет на поиск. Тут я согласен — не сильно влияет.
>Вы произвольно устанавливаете связь между успехом поисковика и морфологией. Точно так же вы устанавливаете связь между успехом ваших продуктов и их качеством, в сравнении с конкурентами. Она может быть, а может и нет, серьёзных тестов никто не видел.
>Скажем, выделение объектов и событий, определение тональности надо было делать три года назад, сейчас-то чего мериться? Мериться или нет — это каждый для себя решает. Задача индустрии — впихивать свои продукты, если они впихиваются без конкурсов, то зачем в них участвовать? Я не о том писал, вы оценили чужие морфологии, тогда как публичных тестов не было и методики не известны. До этого так же оценивали свою определялку тональностей, типа лучше её нету. И тоже без тестов. Эти оценки при наличии в тредике достаточного количества других спецов выглядят слегка нелепо, мы же не на базаре. Если оценивать по баблу, то и Яндекс мог бы сказать — у нас лучшая морфология, потому что мы доросли с ней до IPO и стоим теперь много ярдов. Апорт сдох, морфология — говно. Орфо стоит гораздо меньше Яндекса, ну и морфология там так себе.
Я не занимаюсь поиском 24/7, но могу высказать мнение от российской поисковой науки. Какая морфология была в поисках начала века, когда появился лозунг про выдающуюся русскую морфологию в Яндексе? Вроде у всех были только леммизаторы, ну и всё. Леммизатор важен, как минимум при поиске в документах на русском языке. Его наличие резко улучшает качество. В этом смысле морфология для поиска важна, даже более того — она необходима. Другое дело, на сколько важно её качество. Если использовать какой-нибудь простенький стеммер или чюда-морфологию, то разница в качестве будет только на некоторой части запросов, в среднем она будет не большой. В начале века это было совсем не важно и тут Ашманов прав — лозунг Яндекса был исключительно рекламным. Что касается того, чья морфология была лучше, так это определяется только тестами на правильных и верифицированных данных. Пока тестов нет — сравнивать нет смысла. У Ашманова есть замечательный Орфо, который лучше всех продаётся. Однако это не говорит о том, что он лучше. Ашмановские технологии вообще не плохо продаются, хотя их качество не известно, они никогда не участвовали в профессиональных соревнованиях, ни на РОМИПе, ни на Диалоге.
>Очень долго не мог поверить, что в IT индустрии можно так думать- все же понимание того, как работает Интернет вполне приводит к либеральным воззрениям. Оффтоп: регулярно читая Роем вполне легко увидеть, что к либеральным воззрениям приводит не понимание того, как работает интернет, а непонимание того, что по осям.
Переиграть американцев в такой юрисдикции, как Кипр — очень круто, поздравляю! Спасибо Ашманову и всем, кто помогал, вытащили соотечественника. Если бы вы добились, скажем, отказа в экстрадикции — честь вам и почет, а так… Вы невнимательно читали буквы. Отказать в экстрадикции было нельзя, даже теоретически. Можно было только затянуть процесс. Ну и с омериканскими напёрсточниками сыграли по напёрсточным правилам, так что всё гуд.
[QUOTE]Гудман, ты конечно прав. Насчет незначительного преувеличения. Смотри, Калинин пишет — «Было 70 тысяч переходов, вместо этого 20-25 тысяч ушли к конкурентам» То есть реальный трафик Яндекса — одна треть. Остальное — трояноботнетская хренотень.[/QUOTE] Элит, из одного этого факта выводы сделать не получится. Там и другие объяснялки есть. Но разнообразных фактов, на сколько я наслышан, много… Да и у меня такие есть, исключительно математические. Походу, «некий несеошник, похожий на» не слишком заморачивается с правильной моделью накрутки и это примерно ловится даже без кликстримовской статы. Со статой ГА + счетчика Мыла можно было бы до долей процента отловить лишнее. :) [QUOTE]Собственный ли это ботнет Яндекса или сеопульт помогает — вопрос отдельный.[/QUOTE] Соглашений между ссылочными биржами/агрегаторами и поисковиком вроде бы нет. Хотя тут настоящие накрутки может быть и не нужны, достаточно накрутить счетчики LI и TNS. Первый накрутит любой школьник, а второй могут и агрегаторы, они ведь парсят десятки миллионов запросов, и, как правило, органику, а не XML. Почему так — хз, может и для того, чтобы счетчики TNS грузить. P.S. Сегодня показали свежак про «войну дистрибуций», [URL=http://forum.searchengines.ru/showthread.php?p=10864961#post10864961]тут[/URL]. P.P.S. Отчаянные дистрибуторы юзают даже хацкерские каналы, делая загрузки через ботнеты. По слухам, некоторое время назад эти каналы дистрибуции занимал Яндекс. А каковы слухи на сегодня? Кто-то перекупил хацкеров, или не?
Ашмановский классификатор использует технологии того же уровня, только был написан тыщу лет назад. И уже тогда не был прорывным, просто одним из, даже в рамках России. Данный «концептуальный поиск» правильнее было бы назвать «концептуальный поиск прошлого века».
Дело-то закрыто, но про «честного» «бизнесмена» Сёму лучше рассказать родственникам ключевых свидетелей по этому делу. Самим свидетелям рассказать не получится, они внезапно померли. Доказательная база рассыпалась.
мне кажется что это немедленно объявят фальсификацией на деньги госдепа Госдеп к этой потешной статье скорее всего не причастен, т.к. среди фамилий обиженных «бизнесменов» там фигурирует Сёма Могилевич из [URL=http://www.fbi.gov/wanted/topten]топ-10[/URL] разыскиваемых ФБР. Некоторые другие фамилии также доставляют не мало лулзов.
[QUOTE]упертым товарищам, до сих пор делающим вид, что в декабре не было массовых фальсификаций, предлагаю ответить на вопрос: с чего это так на декабрьских выборах москвичи прониклись любовью к ЕдРу aka ПЖиВ? Путин в марте получил в Москве худший результат по стране, а у ЕдРа в Москве 3 месяцами ранее якобы был почти такой же процент голосов, как и в целом по стране. И по России у Путина большая прибавка голосов по сравнению с ЕдРом, а в Москве почему-то нет. Почему же? Избиратели чудят? Или все же Собянин с Горбуновым в декабре постарались?[/QUOTE] Упертым, до сих пор делающим вид, что они выявили 100500 случаев массовых фальсификаций в декабре, можно было бы и самим заметить, что после декабрьских выборов на партию власти и конкретно Путена было вылито огромное число негатива, в основном фейкового. Чего не было в таком количестве до декабрьских. На эти массовые фейки ведется в основном московское хомячество, что легко увидеть по количеству приходящих на оппозиционные митинги в разных городах. Потому и результаты такие, очевидно же.
>каков процент кликов по рекламе у поисковиков, когда они выяснили интересы пользователя через его поисковые запросы, а рекламу показали уже на стороннем сайте (например в почте). Какой процент сегодня — не очень важно. При качественном улучшении таргетинга он может сильно вырасти, как и конверсия.
А с каких это пор википедия стала свободным знанием без цензуры? Некоторое время назад мой товарищ, доцент Ульяновского гос. университета, пытался внести правки в ряд статей. Его оппонент, настаивавший на своей версии (наверняка не верной), некоторое время пободался правками, после чего попытался товарища забанить. В итоге вики-авторитетный оппонент победил, забанив всю подсеть айпишников универа, никто из ученых и преподов не мог попасть в вики какое-то время. После таких вывертов кричать о том, что вики против цензуры — как-то слегка забавно.
Я был на этой секции и поддержу Перекопского. Он был вполне корректен. Вирин вел себя вызывающе, приватизировав микрофон (чем создал мелкую проблему для задающих вопросы), выскочил к сцене, хотя никто его туда не приглашал и стал рассказывать про смешные 30%. Сложилось впечатление, что он посчитал всех за лохов, которые схавают эту туфту, ну а себя — хозяином ситуации. Вирин конечно известный персонаж, причем иногда с довольно интересными мыслями, но эта известность права быдлячить вроде не дает. Беспредельные накрутки адидаса уже были отмечены выше в треде специалистами, им они были видны и без логов ВКонтакта. Так что инопланетян щёлкнули по носу заслуженно. Объяснялки Вирина не интересны. С другой стороны, понятно, что накручивают все и забанивание НЛО никого не напугает, просто станут осторожнее. Поэтому выбор «пяти лучших» мне видится не совсем правильным, лучше взять в список больше компаний и регулярно проводить показательное забанивание самой косячной. Тогда будет больше стимулов совершенствовать ботов и в итоге их себестоимость с большей вероятностью вырастет до невыгодной.
Онлайн-версия Compreno уже есть — http://ns1.abbyy.com/ru Не инсайд, потому что [URL=http://www.google.ru/search?ie=UTF-8&hl=ru&q=ABBYYCompreno]нагуглилось[/URL]. Кто поделится регистрацией?
По оценке AV-Comparatives Касперский — Product of the Year 2011, причем победа убедительная, судя по табличке — только у Каспера строка оценок полностью зеленая. По тесту Гартнера Касперский впервые вошел в сектор лидеров. Дважды поздравляю ЛК! Но что касается ЕКА, то Ашманов скорее всего прав. По теме треда — у меня позиция похожа на ашмановскую, я пока скептически отношусь к такому подходу. Подождем нормальных тестов и профессиональных оценщиков. Если действительно получится, будет нереально круто. Ну и в целом Абби за свои труды и упорство достойно уважения, даже если ничего не выйдет.
>Приношу извинения гудмену за «недоученный» Alter Ego, я не умею обижаться, так что забейте. Мои фундаментальные труды появились уже после того, как меня сманили в «финансовое подполье», так что все засекречено, можете считать, что их нет. Что касается статей в IR, так это мы прикалываемся слегка. Мы смотрим на отрасль со стороны, без груза многолетнего IR-опыта, поэтому иногда можем предложить какие-то необычные для отрасли методы, очевидные в других отраслях. Поисковым людям это интересно (не Яндексу), они со мной общаются, получают кучу фишек на халяву, может уже и внедрили что-то, а может и нет. Я в данном случае не монетизируюсь, потому отдаю найденные фичи просто так. К трудам Даши я отношусь без особого восторга, но и лулзов там вроде нет после беглого просмотра. Я вообще к текущим танцам с бубнами вокруг «универсальности» ML-методов отношусь как минимум иронично. А ML-конкурсы считаю бредом. Вот такое вот мнение математика со стороны, может и ошибочное, но высказанное в открытую, под альтерэгами я не пишу. Что касается Дашиных достижений, то эти достижения оценивать в данном случае не интересно. Зарплату платят не за лычки, а за текущий вклад. У Даши новые алгоритмы пачками не заметны, а про старые за время работы в Яндексе у нее все выяснили. Ну и зачем платить дальше повышенную зарплату?
anatolix [URL=http://itman.livejournal.com/442772.html?thread=5420692#t5420692]написал[/URL], что всем сделали ускоренный вестинг, так что нет повода для пинания Яндекса. И да — в долине, как и во всей омерике, внезапные увольнения считаются нормой.
Если участие ничего не стоит — можно и участвовать. Если надо отрывать людей, настраиваться — даже дня рабочего времени жалко. Ну у вас же есть общий алгоритм, который как-то определяет тональность. Чтобы его прогнать на дорожке РОМИПа — дня рабочего времени скорее всего и не потребуется. Зато получите интересный расклад, на сколько ваш не тюнингованный отличается от «инвалидских» обученных. Неужели не любопытно? И никто за это не обидит, т.к. всегда можно сказать, что на обучение времени было жалко, а обученные в узких тематиках у вас работают лучше в N раз.
Очень надеюсь, что что-то ещё появится в будущем, рунету очень не хватает подобных мероприятий. Чтобы оно продолжилось, лучше всего съездить на Диалог и убедить всех нынешних участников повторить. Иначе хз.
Нет, Гудман, это вы уныло врёте. Я не заявлял «неоднократно», что «у нас определялка лучше». Это вам от общей злости и самомнения почудилось. Идите тред почитайте. Да ладно, откуда у меня злость? Я просто прикалываюсь. По-доброму, кстати. И вы опять заявили, что у вас определялка лучше, т.к. у вас есть технология, а у других: технологии у них нет и не было никогда. Конечно у них не было, куча заявок на текущую дорожку по сентименту именно об этом и говорит. Если бы технологии у них были, они бы не заявлялись на РОМИП, а поплевывали как бы свысока, как вы. А вы сейчас только что в точности повторили аргументы, приведённые мною постом выше: — Да правила РОМИПа можно нарушать и всем рассказывать, что ты чемпион… — Да мы тут конкретные понтовые поцоны и не уважаем тех, кто не в РОМИПе… На РОМИПе нет соревнования за лучший результат, там цели другие. Откуда тогда взяться чемпионам? А конкретные пацаны следят тут за тем, чтобы комерсы фильтровали свой базар, эта да. доказать свой личный калибр в этих обсуждениях на Роеме вы не можете — всё больше личные обиды, наезды и попытки вставать на цыпочки. У меня нет меркантильных интересов вообще, а в IT тем более. Потому и калибр высовывать не интересно ни разу.
Мы обсуждали якобы пользу РОМИПа для тестирования и маркетинга готовых продуктов в области поиска или извлечения мнений. В той дискуссии так и не привели убедительных аргументов, чем это полезно. Кроме «да от РОМИПа продажи станут на 78% шелковистее!», «да можно нарушить правила и говорить всем клиентам на ухо, что ты чемпион!», «да тебя пацаны не будут уважать, если тебя нет в РОМИПе!». Мы обсуждали совсем другое. Вы неоднократно заявили о том, что лучше всех умеете определять тональность, попутав аудитории. Такие не убедительные заявления можно клиентам делать, а не на Роеме, который читают в том числе и люди «в теме». Поэтому вам и было предложено показать свою определялку на РОМИПе, но вы уныло съехали. И, кстати, напрасно — там по слухам уже около двадцати участников набралось, наверняка будет интересная дорожка. И зря вы привязываетесь к анонимности, на РОМИПе давно её нет, де-факто. Если посмотреть все статьи семинара по дорожке, то все участники публикуют общие таблицы результатов, указывая на свои прогоны. Из этих публикаций имена авторов каждого прогона восстанавливаются полностью. Вместо анонимности используется подход «мы тестировали не боевой алгоритм, а экспериментальный, проверяя какие-то новые идеи».
Alter Ego, виртуально — разбогатели. Реально — нет. Какой смысл считать мифическую прибыль DST по $26? По такой цене 5.5% акций они сейчас не смогли бы продать на бирже.
А откуда сведения, что DST что-то заработало на Групоне? Они продали акций Групона больше чем на вложенные $75М? Если нет, то пока о заработке рано говорить. Деньги сейчас модно вкладывать в самые большие пузыри и эти пузыри в основном вне РФ. Все считают, что они-то уж точно выйдут в кэш вовремя. Ога.
@lexa, ну да, могут. Это ограничивает область применения результатов семинара, но альтернативы все равно нет. Я бы даже результаты 2009 и 2010 не стал сравнивать в абсолютных цифрах, хотя некоторые участники так делали, сравнивая свое прошлогоднее с текущим. Думаю, что имеет смысл сравнивать либо с чужими в пределах одного года (если чьи-то метрики явно хуже лидеров, то что-то нужно менять, а если отставание есть, но не большое, то скорее всего все хорошо), либо запускать несколько своих прогонов и сравнивать только их, между собой. Я по второму варианту гонял, т.к. он наиболее эффективный. А на тот факт, что по многим метрикам результаты получились лучшими среди всех, я щеки не особо раздувал, т.к. это мало о чем говорит. Разве что для понтов сгодится.
@lexa, я думаю, что да. За эти 6 лет поиск сильно изменился (даже по текстам), ну и семинар тоже. Другие коллекции, другие алгоритмы участников (лучше находят), качество асессоров выросло в 2010-м (судя по дорожке аннотирования, где у меня результаты за 2 года, есть с чем сравнивать). Может и методика оценок асессорами сменилась, но тут я не уверен, старые методики не нашел. Опять же — я смотрел полноту по более длинным запросам, как бы по более сложным. Если на какой-то короткий запрос ответов явно больше глубины оцениваемого пула, то «полнота по Лехе» не особо интересна, т.к. не просто ее применить. В таких случаях методика если и будет сбоить, то редко и скорее только в теории. И по минимуму метрик, а всего метрик считалось почти два десятка, так что не критично ни разу.
Ой! Вот в одной из PDF-ок (см. выше по треду) приведен график. По оси Хэ там глубина котла, по оси У — количество новых (релевантных) документов. И оный график асимптотически приближается вовсе не к нулю, а к какой-то константе (разной для AND и OR). Из чего следует, что никакой «полноты 100% по мне» там нету. Хех. lexa, вы невнимательно смотрели в пдф-ку. Там графики исследований за 2003-2004 годы, когда были другие коллекции, другие алгоритмы у участников, и, может быть, даже другие методики оценки для асессоров (на счет оценок — я не в курсе). Если там чего и нету — какое отношение это имеет к моему утверждению, что в 2010-м «полнота по Лёхе» была отличной? С тех пор многое изменилось, в том числе и на РОМИПе. И алгоритмы ранжирования явно прибавили в качестве. Вообще, меня данная дискуссия преизрядно развлекает. На один и тот же вопрос я получаю три разных ответа. Вот про полноту — она не нужна вообще — она не нужна, потому что слишком дорого — она и так есть. Ну и? Все утверждения верны. Первое вытекает из второго. Например в большом поиске полнота хардкорно запрещена, для точной оценки берется несколько десятков тысяч примерно подходящих кандидатов, хотя релевантных вариантов могут быть миллионы и где-то там затерялся самый замечательный. Последнее верно (по моему мнению) в частном случае поисковых дорожек РОМИП-2010, которые мы тут и обсуждали. Попробуйте не удивляться, а понять.
Я повторюсь про «полноту по Лёхе» в поисковых дорожках на РОМИПе. Она близка к 100%, потому что коллекции маленькие, выбирать ответы особо не из чего и все находится той или иной системой. Проверялось вручную, на паре сотен запросов, с целью найти витальные и релевантные+, не попавшие в общий котел. Не нашли ни одного, запросы брали из самых длинных в словах. Так что если такие и бывают, то в крайне малом количестве.
Развитие классификаторов, делящих запросы на узкие типы, каждый со своей асессорской разметкой и своей формулой ранжирования — вот будущее поиска. Это ближайшее будущее. Настоящее будущее — все же за пониманием смысла текста. Поэтому копать в текстовое ранжирование полезно, как ни крути.
А задача — «решенная» не в том смысле, что некуда копать, а в том — что нет смысла копать т.к. другие факторы ранжирования уже весят больше, чем возможная дельта от улучшения имеющихся. Задача пока окончательно не решенная даже на уровне взвешивания слов. А вес разных групп факторов в ранжировании не постоянный, он все время будет меняться. Хоронить текстовую релевантность не стоит, она на сегодня потеряла в весе, потому что в соответствующих технологиях нет большого прогресса, а в других есть. Некоторые это понимают, потому и устраивают семинары типа РОМИПа или TREC-а. Какие факторы весят на сегодня больше я не готов говорить по всем поисковикам, т.к. данные не из всех вываливаются пачками. Думаю, что у всех по-разному. С развитием технологий понимания смысла, текстовая составляющая опять вырастет и для многих запросов (особенно многословных) станет решающей. Пожалуйста, расскажите, прошу вас, коллега, что такое «определять тональность в общем случае», как вы понимаете это понятие, так сказать? Понимаю так же, как и все, есть текст о чем-то, в котором это что-то оценивается. Для упрощения задачи допустим, что мы знаем, что именно. Нужно определить тональность оценки. Как вы сами писали выше, ваши алгоритмы затачиваются под узкую область, т.е. в общем случае работать будут слабо. Ну раз вы говорите, что будут косячить — вы же специалист, значит — будут косячить. Вероятно, это неправильно. Научный позор, так сказать. Почему это не правильно и позор? Это нормально. Просто желательно фразы строить корректно, типа «в некоторых узких тематиках мы хорошо определяем тональность, судя по нашим внутренним метрикам» вместо «мы умеем определять тональность». Школьник, который напишет примитивный парсер Яндекс.Маркета и будет скачивать отзыв с готовой авторской оценкой, также может заявить, что он умеет определять тональность, без указания где и почём. И качество его определялки будет около 100% — выдающийся результат. И в правильных системах, вероятно, какую тематику ни возьми, определение тональности будет работать как влитое. Нельзя ли привести примеров, так сказать, только не поймите меня неправильно, вы же специалист. Вы же наверняка лучше меня знаете, что таких на сегодня нет. Поэтому никто и заявлений не делает. Кроме вас. на самом деле оптимизатор Давно уже нет. Хотя на Се-Тиме до сих пор пишу регулярно.
А Вы кто? Какую организацию представляете? По классификации Ашманова в этом треде я из тех, кто участвовал в РОМИПе «с жиру». Я случайно влез в IR, стало интересно, что-то получилось. Потому и. Никаких меркантильных интересов не преследовалось в принципе. Ерунду говорите. Как-будто Яндекс это такой абстрактный тяни-толкай. Яндекс это конкретные люди. А конкретные люди хотят зажигать и быть известными, публикующимися учеными, а не просто программистами, офисным планктоном, которых за пределами офиса никто не знает. Одно дело писать в своих блогах, а другое дело публиковаться и зажигать. Ну зажигать они и сейчас могут в каком-то объеме. Хотя поддержки от коллег разработчиков скорее всего не получат, у компании другие задачи. Вот доля по LI немного припала – все работают над этим. Наука подождет. И пока компания прибыльная, причем прибыль эта бодро растет с годами – правда на стороне руководства Яндекса. Вы воюете с ветряными мельницами Может и так. 4 дня в непривычном окружении на RCDL дались с трудом, нужно было куда-то выплеснуть. Мы и так знаем, кто круче в определении тональности. Это сомнительно. Пока никто не знает, я не исключаю, что какие-то потенциально интересные коллективы давно могли всех порвать, да только повода не было. Не все же умеют или желают это кому-то впаривать. Дорожка на РОМИПе – хоть какой-то повод для развития данной технологии в стране, и это гуд. Судя по вашим буквам выше, вы ведь пока не умеете определять тональность в общем случае, хотя все время утверждаете обратное. На самом деле вы определяете тональность только по малому набору узких тематик и ваши внутренние метрики наверное говорят, что определяется хорошо. Но шаг в сторону от знакомых тематик – и ваши алгоритмы начнут жестко косячить. Для определения тональности РОМИП полезен, т.к. подходов к этому определению больше одного. И конкуренция на дорожке может родить другие, до которых раньше не додумались, потому что поводов не было. В этом и есть большой теоретический плюс. Да и дальнейшее обсуждение того, что «мы тоже технологическая компания, вот в АОТе морфологию взяли» только подтверждает сказанное. Вроде Никита таких логических цепочек не выстраивал. Они сделали максимум возможного на их месте, нормальный, красивый, удобный разъём к ППБЯ с поиском ключевых слов и накоплением статистики. Выше по склону — стена, на которую им всё равно не влезть, но за 12 тыщ в месяц ничего больше требовать и нельзя Может и стена, хотя в целом это утверждение не только не верно, оно даже забавно. В этой отрасли наука пока слабенькая, во-первых, любой толковый студент может очень быстро освоиться на приличном уровне, а во-вторых – от освоения до вершины путь очень короткий. Посмотрите на работы ведущих гуру в IR – любому математику-студенту там понятно все и с первого беглого прочтения. Это не топология или теория групп, где только для понимания нужно несколько лет усердного учения. Поэтому сделать крутой прорыв могут многие, пришедшие со стороны и не зашоренные унылой кучей простых знаний. Такое может и у Бабоок получиться, чего только в жизни не бывает… Что касается РОМИПа — опять же, высказывание «поисковые машины у участников приличные», показывает, что вы не понимаете, что вам Тутубалин пишет про документы за пределами топа и неустранимый дефект вашей (РОМИПовской) методики в этом месте. «Приличность» поисковых машин только усугубляет этот дефект. Может, не надо в каждом посте так настойчиво употреблять слово «специалист» в отношении себя любимого? Вот Тутубалин — специалист, а про вас это из дискуссии пока не очень ясно. Дык, мы же не на научном диспуте, я стараюсь писать простыми словами и пользоваться аргументами, понятными большинству читателей треда. Никакого «дефекта» в этом случае нет, выше про это уже без меня написали. Публиковаться и зажигать — это (кроме чистого желания славы) — на случай смены работодателя, всё-таки. Работодателю тоже не помешала бы такая слава, но он по другому расставил приоритеты, на что имеет полное право. Проблема в том, что задача имеет мало отношения к реальности. Ну что это за задача — поиск по небольшой коллекции документов без внешних факторов? Корпоративный поиск? Поиск по одному сайту? Даже в этих случаях возникают факторы ранжирования и группировки, внешние относительно текста и на практике полезнее сгруппировать/отранжировать по ним, собственно текстовая релевантность имеет небольшой вес. А в интернетном поиске и вовсе рулят внешние факторы (ссылки и т.п.), clickstream, география, полнота и качество выкачки, борьба со спамом, наконец. Собственно текстовая часть поиска — только малая часть и давно решенная. Ну естественно, это малая часть, хотя и не решенная, даже на сегодняшнем уровне решений. Смысл текста начнет понимать только ИИ, когда-нибудь. Но до ИИ еще в семантику полезут, там пока непаханое поле. На сегодня, когда все решают проблему взвешиванием слов, некоторые методы только появились, например мои спектральные. Вот когда из них выжмется все, можно будет сказать, что на уровне взвешивания задача решенная, больше там некуда пойти. Большой поиск все такие малые части собирает в единое целое, они не всегда плюсуются, иногда одна корректирует другую. Но, если в какой-то из малых частей ваши технологии кому-то уступают, нужно как минимум спуститься с небес на землю. А как максимум – попытаться исправить положение, улучшая свои методы. В этом плане РОМИП помогает, т.к. все данные доступны и всегда можно проверить свои алгоритмы на данных РОМИПа, сравнив потом результаты. Некоторые так и делают, хотя в дорожках не участвуют по каким-то причинам. В этом еще один плюс РОМИПа. А я не про поиск. Уважаемый Гудман (не знаю, где уж он там специалист) по существу обсуждает на бытовом, в общем-то, уровне принципы тестирования систем распознавания, полноту-точность, матстатистику, прочее. Бытовой уровень выбран намеренно, иначе не поймут. «Текстовая часть поиска — давно решённая малая часть» — orly?? «ну какой я специалист», ааа, это многое объясняет +1
Я вам про РОМИП — вы мне про меня. Несколько раз про трусость, про непонимание, про то, что бывший специалист. Перечитайте свой пост, он же смешной: всё время попытки, как у гопников в подворотне, развести на «слабо». Вам сказать по существу нечего? На оценку личностей вроде не я первым перешел. Я влез в эту тему по двум причинам – во-первых, чтобы напомнить сообществу, что сейчас можно сделать независимую оценку определения тональностей в рамках РОМИПа, и, во-вторых, чтобы указать вам на некорректность ваших аргументов для вашей же оценки Бабоок. По обоим пунктам я подробно высказался выше. По первому все понятно, по второму — сама оценка может и верная, а может и нет, мне сложно сказать, я не в теме на сегодня. А вот аргументы – не годные. Ваша логика примерно такая: если компания А привлекает кучу именитых лингвистов и имеет успешные внедрения в лингвистических технологиях, а компания Б пока показала только пару студенческих работ, значит компания А однозначно круче компании Б в определении тональности. Логика странная, такие «значит» в отрасли не приняты, потому что они не опираются ни на какие метрики. Если бы вы сказали, что компании Б не реально получить долю, равную доле А, на рынке крупных корпоратов – вопросов бы не возникло, может оно и так. Но качеством определения тональности пока никто не мерился, поэтому все заявления про «мы круто определяем» выглядят как-то не серьезно. РОМИП — типичное УГ. Тех, кто там участвовал, я практически всех знаю — вижу на конференциях, слушаю рассказы про дорожки. Академические коллективы, использующие постоянно меняющихся студентов и аспирантов и вяло пытающиеся свою автоматическую классификацию продавать политикам и чекистам. Корпоративные поисковики, живущие милостью системного интегратора и вяло продающиеся раз-два в год. Яндекс как спонсор и буксир. Ну и так далее. РОМИП чаще спронсировался РФФИ, а не Яндексом, как мне кажется. С тем, что семинар последних лет был унылым – согласен, с УГ – нет. Все же интересные работы в малом количестве там бывали. И унылость не отменяет объективность оценок РОМИПа, научные конфы унылы практически всегда. Если Трек лучше, а наши местные не смогли сделать свой РОМИП интересным и полезным — это их проблема и ваша, а не моя. Вот вам и остаётся неуклюже пытаться взять «на слабо». Так вы не меряйтесь оценками качества своих технологий, если таких оценок нет, никто и не будет вас брать «на слабо». Но можно ведь и просто построить стада асессоров, чтоб получить объективную оценку своего качества. Такая оценка не обязательно будет объективна, особенно в крупной компании. Потому что ответственные за качество менеджеры всегда хотят создать удобные для себя метрики, убедить всех в их чудесности, а потом работать не над улучшением качества, а над улучшением своих метрик. Если внутренние метрики показывают, что все хорошо, а сравнение в рамках РОМИПа получается в пользу чужих методов от менее крутых коллективов, то в консерватории явно что-то не так. Для чего? Мы и так знаем своё место в этой технологической области. Тогда и не стоит заявлять, что ваше качество лучше того, что вы не мерили. говорить об этом нельзя, это военная тайна, мы вам тайно в переговорной из рук покажем слепые таблички… Я в третий раз напишу – таблички не слепые, все свои дорожки авторы давно показывают сами. попытка вызвать у меня даровой энтузиазм по поводу чужого дела Не, это попытка убедить вас не делать голословных заявлений при специалистах. Потому что выглядят эти заявления иногда забавно. Вот и вы с РОМИПом тоже, по-моему, не имеете аргументов кроме «а давайте вместе зажжём большой-большой костёр и будем петь под гитару пионерские песни!!!». Я в сентиментальных дорожках не буду участвовать, поэтому «а давайте» мне не нужно. Большее количество участников сделает дорожку интереснее, но мне-то что с того? Ну Яндекс-то тут при чём? Почему он должен зажигать? Он должен искать запросы и не пускать Гугл в Рунет. Я вижу, вы из тех, кто тут устраивает длинные унылые срачи про то, что у Яндекса гранаты, ну то есть научные статьи, не той системы. Как будто Яндекс — научный институт. Про гранаты из Яндекса срутся альтегэги (похоже, что их больше одного, типа две штуки), кто за ними прячется – мне не известно. Я обычно с этого ника пишу, прятаться ни к чему. Яндекс был одним из затейников РОМИПа, значит должен был зажигать, привлекая на семинар больше народа и стимулируя этот народ к креативу. Но Яндекс на это забил, как и все остальные затейники РОМИПа, которые так же забили. Что касается гранат или стимулирования отечественной науки, то Яндекс ничего не должен, я бы на его месте делал иначе, но позиция Яндекса в этом месте меня не сильно напрягает. Вопрос: как? Субъективно (сидит жюри и оценивает выдачу)? Или по какой-то формуле? Не сводится ли соревнование к угадыванию этой формулы или свойств жюри? Имеет ли эта оценка отношение к реальной жизни? Не сводится, альтерэга уже примерно объяснил. Оценки всем документам, попавшим в топ-20/50 выбранных запросов, ставят асессоры, уже после выполнения заданий. Хотя например в прошлом году часть из тестовых запросов была прошлогодняя, т.е. с уже имеющимися оценками. И все, кто обучал свои формулы на предыдущих оценках, получили существенный бонус. Тестовые выборки вполне достаточны, на TREC-е они похожи по объему, а результаты TREC-а считаются вполне достоверными (проще на TREC сослаться, чтобы в муть статистики не лезть). По одной коллекции оценивается несколько сотен запросов на глубину до 50-ти. Т.е. оценок на самом деле делается много, вполне достаточно для адекватного расчета метрик качества, которых в последний год считалось 18 штук. Ладно, пусть полнота выкачки — это трудный параметр. Он не трудный, он не интересный в рамках семинара, хотя и важный для реальных систем. нужны руки добровольцев на изрядной выборке в многие тысячи мнений. Ну и рабочее место для разметки, согласованный формат данных, процедура и софт для автоматической оценки. На поисковых дорожках все так и было. А размеченная эталонная база, в случае если эта разметка доступна участникам — тоже не имеет смысла т.к. обучаться будут по этим оценкам. Обучаются на оценках прошлых лет, текущих в это время еще физически нет. Предыдущему альтерэге: беда методики даже не в «100 запросов из 30к» (хотя и в этом тоже), а в том что из всей коллекции оцениваются только те документы, которые попали в топы. А которые не попали — никак не оцениваются. Чем меньше участников, тем больше таких документов и тем больше беда. Оценивается не 100 запросов, а больше. И по-факту беда такая имеется где-то на уровне погрешности, т.к. коллекции не большие (чуть меньше 5М документов на 2 штуки), найти не слишком сложно, а поисковые машины у участников приличные.
Прошу прощения за задержку с ответом, был на RCDL в Воронеже и тупо не хватило времени. Ну вот об этом и речь. Яндекс — лучший поисковик на нашем пространстве. Лучше Гугла, конечно. По какой метрике? По доле в LI или по выручке от рекламы – сегодня лучший. По метрике «количество букв G и O в домене» — лучшие Гугл и Гога. Вы бы определились, чтоле, с метрикой. И конечно, лучше всех, кто там суетится на дорожках. Если вы думали кого-то унизить словом «суетится», то не вышло. На последнем РОМИПе все участники поисковой дорожки (Яндекс, ИСА РАН и я) были значительно круче вас например по баблу (если жен в счет не брать). Так что в данном случае это вы суетитесь, походу. Т.к. не имеете внятных аргументов. А большие дяди в это время и не суетясь решают свои задачи, не всегда меркантильные. И что показывает «независимая оценка»? Что вот этого чувака с его обморочным как бы поиском , приготовленным специально для дорожки, надо взять в тот же Яндекс. Да, достойная цель. Для чувака. Независимая оценка может много чего показывать. Например то, на сколько хороши ваши методы поиска и ранжирования текстов. Если ваша боевая формула показала результаты хуже других – можно плющить соответствующих менеджеров. И что за поиск, «приготовленный специально для дорожки»? Как специалист в небольшом количестве из набора современных поисковых технологий, объясню бывшему специалисту – специально подготовить формулу, при условии случайной выборки из всего набора запросов для оценки, можно только в одном случае – если разметить все 30К выдач вручную, на глубину 50. Это экономически не выгодно, организаторы РОМИПа не создали семинару нужной репутации для таких затрат. Вот на TREC-е было выгодно, кетайцы там и больше размечали. Потому и размер поисковой дорожки TREC-а вырос до миллиона запросов. По-моему, хотят мериться «технологичностью» как раз те, кто меряется на РОМИПе. В силу иллюзии, что это важно. Мериться хотят все, кто в теме и кому важны оценки собственных технологий. Однако не все рискуют делать это публично, рассказывая сказки о недостойности такого занятия. Скажем, нам гамбургский счёт и так известен. Да он понятен и из статей на РОМИПе — как только произносится что-то вроде «а морфологию мы взяли на АОТ.ру». Это позиция гамбургского маркетолога, а не специалиста. Делать выводы по статьям годичной давности в IR специалист бы не стал. Слишком отсталая отрасль, дистанция от новичка до примерно равного в некоторых технологиях может быть пройдена быстрее, чем за год. Это доли медленно прирастают, и новые методы. Мериться технологичностью нужно для кого? Клиентам ваш РОМИП не нужен, он не является критерием выбора исполнителя. Тем более, что он анонимен. Клиенту не нужен, но будет использован конкурентом, который не побоялся выступить и выиграл дорожку. Потому что если клиент станет выбирать, то конкурент ему обязательно покажет свою медальку и намекнет, что некоторые забоялись мериться неспроста. И анонимности давно уже нет, де-факто. Ещё раз повторю: участие в РОМИПе — это академическая деятельность. Для участия в ней нужно тратить время разработчиков. Это можно делать в двух случаях: а) когда нечем больше заняться, то есть в случае академического коллектива или дохлой фирмы без заказчиков, то есть от бедности и от безделья; б) когда, как в Яндексе, есть куча лишних денег и сотня-другая человек с неопределёнными должностными обязанностям, то есть с жиру. Есть и другие случаи, например тестирование новых технологий. Если таковые вяло появлялись на РОМИПе – винить нужно в том числе и Яндекс, который не смог «зажечь» местную поисковую науку. На TREC-е новые технологии тестируются регулярно, некоторые из них оказываются удачными и потом используются тем же Яндексом. Ничего из реальных проблем реального поисковика в реальном грязном Интернете РОМИП не показывает и не обсчитывает. В частности потому, что надо же и остальных инвалидов как-то пустить побегать по дорожке. То есть ввести ограничения, которые позволят им асилеть тест. Почему не решает? Современный большой поиск состоит из совокупности технологий, часть которых можно обкатывать на скромных объемах РОМИПа. Если кто-то поставит себе цель добиться первенства во всех технологиях без исключения, то РОМИП как раз поможет. Семинары такого типа оценивают отдельные составляющие поиска, владение современными технологиями в этих составляющих не требует наличия всех умений и ресурсов Яндекса или Гугла. Заметим, что настоящую независимую оценку качества интернет-поиска Яндекс получает на наших анализаторах AnalyseThis.ru. И другого теста интернет-поиска — увы, в околоземном пространстве пока нет. Про «настоящесть» и «уникальность» — согласен. То, что хотя бы такие оценки кто-то делает – замечательно. К «независимости», декларируемой маркетологами, следует относиться острожно. Что касается метрик качества вашего сервиса, то например мне они не нравятся, но спорить об этом бессмысленно, альтернативу я пока предложить не готов. Нам, впрочем, ни тесты, ни их организация не нравились и раньше — унылые дорожки, неинтересные тесты на то, что было как бы модно три-пять лет назад. Скучные участники, которых видно только на конференциях и на РОМИПЕ, но не видно на рынке. На интересность дорожек можно влиять, если набраться смелости для публичного теста. Что касается видимости на рынке, то не все имеют в своих целях масштабную монетизацию. Некоторым она не нужна, другие не могут. Но новые технологии создавать способны. Что касается долей рынка, то мериться ими не всегда интересно. Этот рынок может очень быстро измениться, каким бы стабильным он не казался. Теоретический пример для рынка поиска – завтра ВКонтакте ставит у себя поиск Гугла и Дуров выступает с пламенной речью «поддержи ВКонтакте – используй только наш замечательный поиск!» Доли тут же изменятся. Или, если взять мониторинг и тональности – кто-то из вашик конкурентов запустит такую услугу в виде приложения в том же ВКонтакте, с похожими ценами, но еще и с услугой «мониторинг знаменитостей». «Свежие сплетни про Жанну Фриске» или «все последние косяки Путина» за 10 рублей в месяц. Доли в этой нишке тут же поменяются, в т.ч. и по баблу. Дорожка на двух участников: один занимает 1 место, второй — угадайте какое. А что ж там их не больше? Вероятно, что-то не так с дорожкой, да и с участниками. А что не так с участниками? Они-то в чем провинились, если организаторы не завлекли больше? Вредилка не выросла. Внезапно. Она отрастет с ростом конкуренции. Трек и РОМИП не влияют и не могут влиять, это скучные академические игры в неизвестно что. Технологии, успешно показавшие себя на TREC-е, бодро используются тем же Яндексом при вычислении факторов матрикснета. Вы предлагаете Гуглу и Яндексу записаться на дорожки РОМИПа или Трека, и потом победителя официально объявить главным поисковиком и передать ему все 100% доли рынка указом Президента РФ? При чем тут «доли рынка», «главный» и «президент»? На этих семинарах вообще все не про то, вы не поняли. В отдельных технологиях большие поисковики могли бы посоревноваться, например в текстовом ранжировании, чистке от спама или в поиске дублей. Но не будут, потому что боязно. В рамках РОМИПа ничего этого померить нельзя, потому хотя бы, что большинство участников ничего про поиск в Интернете не знают и не умеют. Откуда взялся такой забавный вывод про большинство участников?
Ой, да конечно. Да все эти авторитеты дутые, чо про них вуабще говорить-то. Да ладно, не все дутые. На примере бренда «Ашманов» многим в отрасли полезно поучиться. Вы бы лучше пояснили, зачем тем, кто работает на реальном рынке и с реальными клиентами, нужен РОМИП. С одной стороны, это не пиар (нельзя спрашивать, нельзя говорить, как у педиков в американской армии). С другой стороны, вон Никита всё-таки старается допустить утечку, чтоб, значить, это самое, всё же покрасоваться. Давно уже можно. Во-первых, если пролистать для примера доклады участников поисковой дорожки последних лет, то все показывают номера своих прогонов, публикуя при этом общие таблицы. Т.е. сразу понятно, где чьё добро. А, во-вторых, некоторые участники в своих докладах публично исследуют чужие прогоны, потому что всем это интересно. Например, в 2010-м Илья Тихомиров из ИСА РАН выяснил, что кто-то из участников поисковой дорожки не обучал свои формулы, получив при этом отличные результаты. Меня «пропалил». Что касается Никиты, то свои результаты никогда не запрещалось показывать, называя занятые по метрикам места. Никита показал свою технологичность с помощью независимой оценки, а вы нет, показав ему в ответ только большой лингвистический прибор с серверами. С другой стороны, это не сравнение конкурентов и не сравнение свойств продуктов. Чего себя сравнивать — чтобы знать, что на формальном тесте, придуманном умозрительно, ты лучше или хуже тех, кого на рынке нет или у кого система на реальных данных не работает? В поисковых дорожках в прошлые годы соревновались такие участники, что с ними вообще не очень есть о чём говорить, на самом-то деле. Это получение независимой оценки своих технологий. Что касается формальности теста, то правила дорожек не догма, любой желающий поучаствовать может высказывать свои предложения как по набору данных, так и по метрикам качества. И, показав унылые результаты на РОМИПе, потом будет сложно убедить специалистов, что есть какие-то «реальные» данные, и вот на них-то мы да, на них мы всех рвем! Если хотите меряться технологичностью – получите для начала независимые оценки. А если долями рынка и толщиной клиентов, то независимые оценки ни к чему, они ведь и навредить могут. Внезапно. Что касается участников поисковой дорожки последних лет, то можно посмотреть только на тех, кто получал лучшие оценки. Их не много, всего двое. Один из них, Саша Сафронов, после этого пригодился в Яндексе, а другой, гудман, благодаря РОМИПу основал новое направление в информационном поиске – спектральное. За которым большое будущее, зуб даю. Кроме академических возвышенных интересов, что предлагается как мотив затраты очень редких ресурсов разработчиков? Что касается шкурных мотивов, то они появляются только в том случае, когда есть чем пободаться. Вот Яндекс не показал ничего выдающегося в поиске на РОМИПе за последние два года, поэтому пришлось семинар на год прикрыть, открыв взад уже без поисковой дорожки.
watermelon , я подозреваю, что всех упомянутых в этом топике можно вычеркивать, может быть кроме бабоок, да и то сомнительно. Замечательным системам мониторинга честное и объективное соревнование противопоказано, потом ведь не получится запаривать авторитетом и прочими маркетинговыми фишечками.
Устроим показательный бенчмарк, не вопрос. Не, ваш субъективный бенчмарк не покатит, т.к. не сложно будет найти в нем косяки и съехать. Но можно устроить объективный, в рамках РОМИПа. Тем более, что как раз сейчас мы затеваем именно такую [URL=http://romip.ru/forum/viewtopic.php?f=28&t=922]дорожку[/URL]. Присоединяйтесь к обсуждению и участию, любой кипеш приветствуется. Если возникнут проблемы с публикацией первого поста на форуме РОМИПа — пишите админу, т.е. мне, адрес можно из профиля на Роеме найти. Участи в дорожке РОМИПа расставит всех по местам, хотя я сомневаюсь, что все сервисы, упомянутые в данной ветке, захотят участвовать. Ведь кидать маркетинговые понты типа «мы скупили 100500 лингвистов и все компании на рынке» куда проще… Про второе место из двух возможных в снипетной дорожке уже говорилось :) Я занял первое место из двух в той сниппетной дорожке, поэтому выскажу свое более весомое мнение про исследования Ингейта. Ингейт, в отличие от всех остальных компаний своей отрасли, показал, что он ведет какие-то исследовательские работы и не побоялся выставить их напоказ. Да, над статьями Ингейта можно иронизировать, но не стоит забывать, что это был первое их участие в РОМИПе. Но оно было, тогда как остальные компании на такой показ своих достижений не идут, видимо стремновато им.
не прав. Нужно предоставить по научному сотруднику выписку с места работы — института или универа или академии, нии. Можно, но они вроде проверяют иногда, т.е. левая выписка не прокатит. Зарплатная ведомость решает вопрос. Abbyy — это официальная околонаука? У Эбби в составе группы были как российские, так и зарубежные ученые, иначе бы грант не дали. Если вы проживаете а РФ и занимаетесь наукой, но в вашем коллективе нет человека, «осуществляющего научную и (или) преподавательскую деятельность в российском и (или) зарубежном образовательном и (или) научном учреждении», то в Сколково вас не возьмут, не зависимо от крутизны изобретений. Так же не возьмут, если нет «иностранного специалиста, который имеет значительный авторитет в инвестиционной и (или) исследовательской среде.» В кавычках — сколковские буквы из заявления на участие.
Сколково — не универсальный фонд, там финансируют новую науку, которая теоретически сможет окупиться в реальные сроки. Причем финансируются только коллективы из российской официальной околонауки (подтверждается не справкой, а зарплатными ведомостями), которые поддерживает какой-то западный великий научный гуру. У Перельмана нет окупаемости, у Сысоева нет никакой науки. Поэтому Сколково не для них.
Смотря по какому запросу, конечно. По какому еще запросу? В процитированном тобой куске есть слова «в среднем». elite отказался от влияния нефти на клики, т.е. клики на Директ все же были. А выручка за квартал — около нуля. Значит клики на Директ были практически бесплатны целых три месяца, в т.ч. на спец. Если бы так было на самом деле — все клиенты аптемизаторов свалили бы в Директ, в спеце CTR приличный, а денег платить не нужно. Цена на нефть убила бы всех аптемизаторов с их ссылками и накликами.
elite, стоимость среднего клика около нуля — это конечно сильное утверждение, но оно ведь легко проверяется. На Роеме тусит куча спецов по контекстной рекламе. Ты думаешь, они подтвердят, что в конце 2008-го платили в среднем пару центов за спец. размещение в Директе?
Следовательно можно восстановить 4 квартал. Чтобы сходилось. Получается, что выручка за 4 квартал около 0. Падение до нуля — это падение больше, чем падение нефти. Раз выручка за квартал около нуля, то кликов на контекстную рекламу не было. Целый квартал. Ну или «около не было». Ведь там за каждый клик центы какие-то плюсуются, стопудово. Значит цена на нефть влияет на клики по Директу!
Волож (в смысле — Яндекс) не «играет» на бирже, у него другая роль, он эмитент И это никак не мешает Воложу, как бизнесмену, сыграть через другую компанию в короткую. Хотя в данном случае этого точно не было. Да, G00DMAN, вы будете явно удивлены, но эмиссия акций — в аспекте денежных потоков — эквивалентна «игре в короткую». Вовсе нет, эмиссия (как первоначальная при открытии АО, так и дополнительная) эквивалентна «покупке», точнее это не покупка а «изготовление», если по простому. Продажа эмитированных когда-то акций (не важно когда) — это закрытие длинной позиции, фиксация прибыли. Возвращаясь к Яндексу, получается, что он и не «играл», и «позиция» у него не «короткая», а при обратном выкупе акций он, тем не менее, зафиксирует прибыль. Позиция у Яндекса не короткая, а длинная, по тем акциям, которые он еще не продал. При обратном выкупе объем длинной позиции вырастет, никакой фиксации прибыли при этом не произойдет. Вот уж кому — этим фондам — точно никто не помешает купить себе обратно «немножко Яндекса», тем самым возвратив себе контроль над хорошим активом (про который они всё знают, и с которым все отношения налажены) и изрядно при этом «нагреться» финансово. Контроля в тех акциях, что крутятся на бирже вроде мизер, если я не ошибаюсь. Т.е. их выкуп никакого контроля особо не добавит. Изрядно «нагреться» получится только при росте котировок, аднака. Рост пока не очевиден, не следует забывать о «купившему дно — второе дно в подарок!»
megapinion, у вас какая-то каша в голове. В одном абзаце вы утверждаете, что продажа акции это фиксация прибыли, на 5 строчек ниже — что покупка Яндексом по 15 это фиксация. Вы бы определились, чтоле. На самом деле продажа фиксирует прибыль не всегда, а только если была открыта длинная позиция, на покупку. Аналогично — покупка будет фиксировать прибыль, если была открыта позиция на продажу. Т.е. если Яндекс купит по 15, фиксируя прибыль, значит Аркадий играл на понижение, у него была открыта короткая позиция.
О, пацанский жаргон 21 века внезапно доставил. Кукарекус. На сленге того же века, Rasklad — тебе плюсадын. Ида, Rasklad, за 675 рублей кипеш поднимать как-то западло, внатуре.
Дискуссии пользователя
>из 200 000 уголовных дел на предпринимателей до суда дошли 30 000
Ну так это же естественная статистика для нашего законодательства, специально заточенного на воровство западными пейсателями законов.
Уголовное делопроизводство длится достаточно долго, потому что никто особо сотрудничать со следствием не будет. В то же время закрытие ООО (например «слиянием») происходит гораздо быстрее, максимум за пол года, часто раньше. После того, как ОГРН напрочь пропал из реестров, в суд подавать уже нет смысла, не с кем судиться. Ну а документы на закрытие обычно подаются сразу же по возбуждению уголовного дела или даже раньше, после первого визита органов.
Там есть ещё и другой вывод из цифр, который любят всёпропальщики — закрывается большое число бизнесов, а новые не открываются, т.е. задушили крававые. Это потому, что большинство этих бизнесов было «помойками» или «белыми прокладками», временными фирмами для схем ухода от налогов. Директора там совсем не бизнесмены и после первого вызова на допрос открывать на себя новую фирму обычно уже не хотят. Поэтому на бумаге получается некая печальная для бизнеса картина, которой в реале конечно же нет.
В 2015-2016 должно быть очень большое сокращение кол-ва работающих ООО из-за введения новых правил учёта НДС. Схемы с «помойками» больше не работают, т.к. НДС в таких случаях уже не доказать, его же не было и теперь это сразу видно. В теории всё должно было закрыться ещё летом 2015-го, но из-за инерционности бизнеса (точнее — из-за тупорылости), который надеялся на что-то типа «всё равно ко всем не придут, меня-то точно не найдут в этой бигдате», закрылось не много, всё продолжится в этом году. И опять будут крики про умирающий бизнес, который умирать не особо спешит.
>Надеюсь, это была самоирония) С чего бы?
Игорь Ашманов, я про Орфо спорить не хочу, мне Орфо нравится. Докопался я до двух моментов: во-первых, вы отранжировали морфологии в поисках начала века, и это ранжирование ниоткуда не следует. Даже если у вас была самая лучшая морфология, то мало ли, как вы там её прикрутили к Рамблеру? Может быть криво, или вообще не правильно. Ну и публичных тестов не было. А, во-вторых, вы заявили, что морфология для поиска не важна, что очевидно не верно. Для тек, кто не в теме можно так пояснить: если убрать из Крибрума морфологию, то для поиска новых постов в бложеках по слову [ашманов] он не найдет вариантов с [ашманова] и [ашмановым]. Т.е. какая-то морфология должна в поиске быть. Другое дело — на сколько её качество влияет на поиск. Тут я согласен — не сильно влияет.
>Вы произвольно устанавливаете связь между успехом поисковика и морфологией. Точно так же вы устанавливаете связь между успехом ваших продуктов и их качеством, в сравнении с конкурентами. Она может быть, а может и нет, серьёзных тестов никто не видел.
>Скажем, выделение объектов и событий, определение тональности надо было делать три года назад, сейчас-то чего мериться? Мериться или нет — это каждый для себя решает. Задача индустрии — впихивать свои продукты, если они впихиваются без конкурсов, то зачем в них участвовать? Я не о том писал, вы оценили чужие морфологии, тогда как публичных тестов не было и методики не известны. До этого так же оценивали свою определялку тональностей, типа лучше её нету. И тоже без тестов. Эти оценки при наличии в тредике достаточного количества других спецов выглядят слегка нелепо, мы же не на базаре. Если оценивать по баблу, то и Яндекс мог бы сказать — у нас лучшая морфология, потому что мы доросли с ней до IPO и стоим теперь много ярдов. Апорт сдох, морфология — говно. Орфо стоит гораздо меньше Яндекса, ну и морфология там так себе.
Я не занимаюсь поиском 24/7, но могу высказать мнение от российской поисковой науки. Какая морфология была в поисках начала века, когда появился лозунг про выдающуюся русскую морфологию в Яндексе? Вроде у всех были только леммизаторы, ну и всё. Леммизатор важен, как минимум при поиске в документах на русском языке. Его наличие резко улучшает качество. В этом смысле морфология для поиска важна, даже более того — она необходима. Другое дело, на сколько важно её качество. Если использовать какой-нибудь простенький стеммер или чюда-морфологию, то разница в качестве будет только на некоторой части запросов, в среднем она будет не большой. В начале века это было совсем не важно и тут Ашманов прав — лозунг Яндекса был исключительно рекламным. Что касается того, чья морфология была лучше, так это определяется только тестами на правильных и верифицированных данных. Пока тестов нет — сравнивать нет смысла. У Ашманова есть замечательный Орфо, который лучше всех продаётся. Однако это не говорит о том, что он лучше. Ашмановские технологии вообще не плохо продаются, хотя их качество не известно, они никогда не участвовали в профессиональных соревнованиях, ни на РОМИПе, ни на Диалоге.
>Очень долго не мог поверить, что в IT индустрии можно так думать- все же понимание того, как работает Интернет вполне приводит к либеральным воззрениям. Оффтоп: регулярно читая Роем вполне легко увидеть, что к либеральным воззрениям приводит не понимание того, как работает интернет, а непонимание того, что по осям.
Переиграть американцев в такой юрисдикции, как Кипр — очень круто, поздравляю! Спасибо Ашманову и всем, кто помогал, вытащили соотечественника. Если бы вы добились, скажем, отказа в экстрадикции — честь вам и почет, а так… Вы невнимательно читали буквы. Отказать в экстрадикции было нельзя, даже теоретически. Можно было только затянуть процесс. Ну и с омериканскими напёрсточниками сыграли по напёрсточным правилам, так что всё гуд.
[QUOTE]Гудман, ты конечно прав. Насчет незначительного преувеличения. Смотри, Калинин пишет — «Было 70 тысяч переходов, вместо этого 20-25 тысяч ушли к конкурентам» То есть реальный трафик Яндекса — одна треть. Остальное — трояноботнетская хренотень.[/QUOTE] Элит, из одного этого факта выводы сделать не получится. Там и другие объяснялки есть. Но разнообразных фактов, на сколько я наслышан, много… Да и у меня такие есть, исключительно математические. Походу, «некий несеошник, похожий на» не слишком заморачивается с правильной моделью накрутки и это примерно ловится даже без кликстримовской статы. Со статой ГА + счетчика Мыла можно было бы до долей процента отловить лишнее. :) [QUOTE]Собственный ли это ботнет Яндекса или сеопульт помогает — вопрос отдельный.[/QUOTE] Соглашений между ссылочными биржами/агрегаторами и поисковиком вроде бы нет. Хотя тут настоящие накрутки может быть и не нужны, достаточно накрутить счетчики LI и TNS. Первый накрутит любой школьник, а второй могут и агрегаторы, они ведь парсят десятки миллионов запросов, и, как правило, органику, а не XML. Почему так — хз, может и для того, чтобы счетчики TNS грузить. P.S. Сегодня показали свежак про «войну дистрибуций», [URL=http://forum.searchengines.ru/showthread.php?p=10864961#post10864961]тут[/URL]. P.P.S. Отчаянные дистрибуторы юзают даже хацкерские каналы, делая загрузки через ботнеты. По слухам, некоторое время назад эти каналы дистрибуции занимал Яндекс. А каковы слухи на сегодня? Кто-то перекупил хацкеров, или не?
Элит, конверсия из их контекста иногда лучше, чем у конкурентов. Так что бабки во дворе скорее всего слегка завысили.
АиП молодцы, не бросают своих в беде.
Ашмановский классификатор использует технологии того же уровня, только был написан тыщу лет назад. И уже тогда не был прорывным, просто одним из, даже в рамках России. Данный «концептуальный поиск» правильнее было бы назвать «концептуальный поиск прошлого века».
Дело-то закрыто, но про «честного» «бизнесмена» Сёму лучше рассказать родственникам ключевых свидетелей по этому делу. Самим свидетелям рассказать не получится, они внезапно померли. Доказательная база рассыпалась.
мне кажется что это немедленно объявят фальсификацией на деньги госдепа Госдеп к этой потешной статье скорее всего не причастен, т.к. среди фамилий обиженных «бизнесменов» там фигурирует Сёма Могилевич из [URL=http://www.fbi.gov/wanted/topten]топ-10[/URL] разыскиваемых ФБР. Некоторые другие фамилии также доставляют не мало лулзов.
[QUOTE]упертым товарищам, до сих пор делающим вид, что в декабре не было массовых фальсификаций, предлагаю ответить на вопрос: с чего это так на декабрьских выборах москвичи прониклись любовью к ЕдРу aka ПЖиВ? Путин в марте получил в Москве худший результат по стране, а у ЕдРа в Москве 3 месяцами ранее якобы был почти такой же процент голосов, как и в целом по стране. И по России у Путина большая прибавка голосов по сравнению с ЕдРом, а в Москве почему-то нет. Почему же? Избиратели чудят? Или все же Собянин с Горбуновым в декабре постарались?[/QUOTE] Упертым, до сих пор делающим вид, что они выявили 100500 случаев массовых фальсификаций в декабре, можно было бы и самим заметить, что после декабрьских выборов на партию власти и конкретно Путена было вылито огромное число негатива, в основном фейкового. Чего не было в таком количестве до декабрьских. На эти массовые фейки ведется в основном московское хомячество, что легко увидеть по количеству приходящих на оппозиционные митинги в разных городах. Потому и результаты такие, очевидно же.
>каков процент кликов по рекламе у поисковиков, когда они выяснили интересы пользователя через его поисковые запросы, а рекламу показали уже на стороннем сайте (например в почте). Какой процент сегодня — не очень важно. При качественном улучшении таргетинга он может сильно вырасти, как и конверсия.
Выглядит утопично.
А с каких это пор википедия стала свободным знанием без цензуры? Некоторое время назад мой товарищ, доцент Ульяновского гос. университета, пытался внести правки в ряд статей. Его оппонент, настаивавший на своей версии (наверняка не верной), некоторое время пободался правками, после чего попытался товарища забанить. В итоге вики-авторитетный оппонент победил, забанив всю подсеть айпишников универа, никто из ученых и преподов не мог попасть в вики какое-то время. После таких вывертов кричать о том, что вики против цензуры — как-то слегка забавно.
Я был на этой секции и поддержу Перекопского. Он был вполне корректен. Вирин вел себя вызывающе, приватизировав микрофон (чем создал мелкую проблему для задающих вопросы), выскочил к сцене, хотя никто его туда не приглашал и стал рассказывать про смешные 30%. Сложилось впечатление, что он посчитал всех за лохов, которые схавают эту туфту, ну а себя — хозяином ситуации. Вирин конечно известный персонаж, причем иногда с довольно интересными мыслями, но эта известность права быдлячить вроде не дает. Беспредельные накрутки адидаса уже были отмечены выше в треде специалистами, им они были видны и без логов ВКонтакта. Так что инопланетян щёлкнули по носу заслуженно. Объяснялки Вирина не интересны. С другой стороны, понятно, что накручивают все и забанивание НЛО никого не напугает, просто станут осторожнее. Поэтому выбор «пяти лучших» мне видится не совсем правильным, лучше взять в список больше компаний и регулярно проводить показательное забанивание самой косячной. Тогда будет больше стимулов совершенствовать ботов и в итоге их себестоимость с большей вероятностью вырастет до невыгодной.
Онлайн-версия Compreno уже есть — http://ns1.abbyy.com/ru Не инсайд, потому что [URL=http://www.google.ru/search?ie=UTF-8&hl=ru&q=ABBYYCompreno]нагуглилось[/URL]. Кто поделится регистрацией?
По оценке AV-Comparatives Касперский — Product of the Year 2011, причем победа убедительная, судя по табличке — только у Каспера строка оценок полностью зеленая. По тесту Гартнера Касперский впервые вошел в сектор лидеров. Дважды поздравляю ЛК! Но что касается ЕКА, то Ашманов скорее всего прав. По теме треда — у меня позиция похожа на ашмановскую, я пока скептически отношусь к такому подходу. Подождем нормальных тестов и профессиональных оценщиков. Если действительно получится, будет нереально круто. Ну и в целом Абби за свои труды и упорство достойно уважения, даже если ничего не выйдет.
>Приношу извинения гудмену за «недоученный» Alter Ego, я не умею обижаться, так что забейте. Мои фундаментальные труды появились уже после того, как меня сманили в «финансовое подполье», так что все засекречено, можете считать, что их нет. Что касается статей в IR, так это мы прикалываемся слегка. Мы смотрим на отрасль со стороны, без груза многолетнего IR-опыта, поэтому иногда можем предложить какие-то необычные для отрасли методы, очевидные в других отраслях. Поисковым людям это интересно (не Яндексу), они со мной общаются, получают кучу фишек на халяву, может уже и внедрили что-то, а может и нет. Я в данном случае не монетизируюсь, потому отдаю найденные фичи просто так. К трудам Даши я отношусь без особого восторга, но и лулзов там вроде нет после беглого просмотра. Я вообще к текущим танцам с бубнами вокруг «универсальности» ML-методов отношусь как минимум иронично. А ML-конкурсы считаю бредом. Вот такое вот мнение математика со стороны, может и ошибочное, но высказанное в открытую, под альтерэгами я не пишу. Что касается Дашиных достижений, то эти достижения оценивать в данном случае не интересно. Зарплату платят не за лычки, а за текущий вклад. У Даши новые алгоритмы пачками не заметны, а про старые за время работы в Яндексе у нее все выяснили. Ну и зачем платить дальше повышенную зарплату?
Бегло просмотрел труды Даши — не впечатлило. Поводов платить ей двойной оклад не видно ни разу.
anatolix [URL=http://itman.livejournal.com/442772.html?thread=5420692#t5420692]написал[/URL], что всем сделали ускоренный вестинг, так что нет повода для пинания Яндекса. И да — в долине, как и во всей омерике, внезапные увольнения считаются нормой.
Если участие ничего не стоит — можно и участвовать. Если надо отрывать людей, настраиваться — даже дня рабочего времени жалко. Ну у вас же есть общий алгоритм, который как-то определяет тональность. Чтобы его прогнать на дорожке РОМИПа — дня рабочего времени скорее всего и не потребуется. Зато получите интересный расклад, на сколько ваш не тюнингованный отличается от «инвалидских» обученных. Неужели не любопытно? И никто за это не обидит, т.к. всегда можно сказать, что на обучение времени было жалко, а обученные в узких тематиках у вас работают лучше в N раз.
Очень надеюсь, что что-то ещё появится в будущем, рунету очень не хватает подобных мероприятий. Чтобы оно продолжилось, лучше всего съездить на Диалог и убедить всех нынешних участников повторить. Иначе хз.
Нет, Гудман, это вы уныло врёте. Я не заявлял «неоднократно», что «у нас определялка лучше». Это вам от общей злости и самомнения почудилось. Идите тред почитайте. Да ладно, откуда у меня злость? Я просто прикалываюсь. По-доброму, кстати. И вы опять заявили, что у вас определялка лучше, т.к. у вас есть технология, а у других: технологии у них нет и не было никогда. Конечно у них не было, куча заявок на текущую дорожку по сентименту именно об этом и говорит. Если бы технологии у них были, они бы не заявлялись на РОМИП, а поплевывали как бы свысока, как вы. А вы сейчас только что в точности повторили аргументы, приведённые мною постом выше: — Да правила РОМИПа можно нарушать и всем рассказывать, что ты чемпион… — Да мы тут конкретные понтовые поцоны и не уважаем тех, кто не в РОМИПе… На РОМИПе нет соревнования за лучший результат, там цели другие. Откуда тогда взяться чемпионам? А конкретные пацаны следят тут за тем, чтобы комерсы фильтровали свой базар, эта да. доказать свой личный калибр в этих обсуждениях на Роеме вы не можете — всё больше личные обиды, наезды и попытки вставать на цыпочки. У меня нет меркантильных интересов вообще, а в IT тем более. Потому и калибр высовывать не интересно ни разу.
Мы обсуждали якобы пользу РОМИПа для тестирования и маркетинга готовых продуктов в области поиска или извлечения мнений. В той дискуссии так и не привели убедительных аргументов, чем это полезно. Кроме «да от РОМИПа продажи станут на 78% шелковистее!», «да можно нарушить правила и говорить всем клиентам на ухо, что ты чемпион!», «да тебя пацаны не будут уважать, если тебя нет в РОМИПе!». Мы обсуждали совсем другое. Вы неоднократно заявили о том, что лучше всех умеете определять тональность, попутав аудитории. Такие не убедительные заявления можно клиентам делать, а не на Роеме, который читают в том числе и люди «в теме». Поэтому вам и было предложено показать свою определялку на РОМИПе, но вы уныло съехали. И, кстати, напрасно — там по слухам уже около двадцати участников набралось, наверняка будет интересная дорожка. И зря вы привязываетесь к анонимности, на РОМИПе давно её нет, де-факто. Если посмотреть все статьи семинара по дорожке, то все участники публикуют общие таблицы результатов, указывая на свои прогоны. Из этих публикаций имена авторов каждого прогона восстанавливаются полностью. Вместо анонимности используется подход «мы тестировали не боевой алгоритм, а экспериментальный, проверяя какие-то новые идеи».
Alter Ego, виртуально — разбогатели. Реально — нет. Какой смысл считать мифическую прибыль DST по $26? По такой цене 5.5% акций они сейчас не смогли бы продать на бирже.
А откуда сведения, что DST что-то заработало на Групоне? Они продали акций Групона больше чем на вложенные $75М? Если нет, то пока о заработке рано говорить. Деньги сейчас модно вкладывать в самые большие пузыри и эти пузыри в основном вне РФ. Все считают, что они-то уж точно выйдут в кэш вовремя. Ога.
@lexa, ну да, могут. Это ограничивает область применения результатов семинара, но альтернативы все равно нет. Я бы даже результаты 2009 и 2010 не стал сравнивать в абсолютных цифрах, хотя некоторые участники так делали, сравнивая свое прошлогоднее с текущим. Думаю, что имеет смысл сравнивать либо с чужими в пределах одного года (если чьи-то метрики явно хуже лидеров, то что-то нужно менять, а если отставание есть, но не большое, то скорее всего все хорошо), либо запускать несколько своих прогонов и сравнивать только их, между собой. Я по второму варианту гонял, т.к. он наиболее эффективный. А на тот факт, что по многим метрикам результаты получились лучшими среди всех, я щеки не особо раздувал, т.к. это мало о чем говорит. Разве что для понтов сгодится.
@lexa, я думаю, что да. За эти 6 лет поиск сильно изменился (даже по текстам), ну и семинар тоже. Другие коллекции, другие алгоритмы участников (лучше находят), качество асессоров выросло в 2010-м (судя по дорожке аннотирования, где у меня результаты за 2 года, есть с чем сравнивать). Может и методика оценок асессорами сменилась, но тут я не уверен, старые методики не нашел. Опять же — я смотрел полноту по более длинным запросам, как бы по более сложным. Если на какой-то короткий запрос ответов явно больше глубины оцениваемого пула, то «полнота по Лехе» не особо интересна, т.к. не просто ее применить. В таких случаях методика если и будет сбоить, то редко и скорее только в теории. И по минимуму метрик, а всего метрик считалось почти два десятка, так что не критично ни разу.
Ой! Вот в одной из PDF-ок (см. выше по треду) приведен график. По оси Хэ там глубина котла, по оси У — количество новых (релевантных) документов. И оный график асимптотически приближается вовсе не к нулю, а к какой-то константе (разной для AND и OR). Из чего следует, что никакой «полноты 100% по мне» там нету. Хех. lexa, вы невнимательно смотрели в пдф-ку. Там графики исследований за 2003-2004 годы, когда были другие коллекции, другие алгоритмы у участников, и, может быть, даже другие методики оценки для асессоров (на счет оценок — я не в курсе). Если там чего и нету — какое отношение это имеет к моему утверждению, что в 2010-м «полнота по Лёхе» была отличной? С тех пор многое изменилось, в том числе и на РОМИПе. И алгоритмы ранжирования явно прибавили в качестве. Вообще, меня данная дискуссия преизрядно развлекает. На один и тот же вопрос я получаю три разных ответа. Вот про полноту — она не нужна вообще — она не нужна, потому что слишком дорого — она и так есть. Ну и? Все утверждения верны. Первое вытекает из второго. Например в большом поиске полнота хардкорно запрещена, для точной оценки берется несколько десятков тысяч примерно подходящих кандидатов, хотя релевантных вариантов могут быть миллионы и где-то там затерялся самый замечательный. Последнее верно (по моему мнению) в частном случае поисковых дорожек РОМИП-2010, которые мы тут и обсуждали. Попробуйте не удивляться, а понять.
Я повторюсь про «полноту по Лёхе» в поисковых дорожках на РОМИПе. Она близка к 100%, потому что коллекции маленькие, выбирать ответы особо не из чего и все находится той или иной системой. Проверялось вручную, на паре сотен запросов, с целью найти витальные и релевантные+, не попавшие в общий котел. Не нашли ни одного, запросы брали из самых длинных в словах. Так что если такие и бывают, то в крайне малом количестве.
Развитие классификаторов, делящих запросы на узкие типы, каждый со своей асессорской разметкой и своей формулой ранжирования — вот будущее поиска. Это ближайшее будущее. Настоящее будущее — все же за пониманием смысла текста. Поэтому копать в текстовое ранжирование полезно, как ни крути.
А задача — «решенная» не в том смысле, что некуда копать, а в том — что нет смысла копать т.к. другие факторы ранжирования уже весят больше, чем возможная дельта от улучшения имеющихся. Задача пока окончательно не решенная даже на уровне взвешивания слов. А вес разных групп факторов в ранжировании не постоянный, он все время будет меняться. Хоронить текстовую релевантность не стоит, она на сегодня потеряла в весе, потому что в соответствующих технологиях нет большого прогресса, а в других есть. Некоторые это понимают, потому и устраивают семинары типа РОМИПа или TREC-а. Какие факторы весят на сегодня больше я не готов говорить по всем поисковикам, т.к. данные не из всех вываливаются пачками. Думаю, что у всех по-разному. С развитием технологий понимания смысла, текстовая составляющая опять вырастет и для многих запросов (особенно многословных) станет решающей. Пожалуйста, расскажите, прошу вас, коллега, что такое «определять тональность в общем случае», как вы понимаете это понятие, так сказать? Понимаю так же, как и все, есть текст о чем-то, в котором это что-то оценивается. Для упрощения задачи допустим, что мы знаем, что именно. Нужно определить тональность оценки. Как вы сами писали выше, ваши алгоритмы затачиваются под узкую область, т.е. в общем случае работать будут слабо. Ну раз вы говорите, что будут косячить — вы же специалист, значит — будут косячить. Вероятно, это неправильно. Научный позор, так сказать. Почему это не правильно и позор? Это нормально. Просто желательно фразы строить корректно, типа «в некоторых узких тематиках мы хорошо определяем тональность, судя по нашим внутренним метрикам» вместо «мы умеем определять тональность». Школьник, который напишет примитивный парсер Яндекс.Маркета и будет скачивать отзыв с готовой авторской оценкой, также может заявить, что он умеет определять тональность, без указания где и почём. И качество его определялки будет около 100% — выдающийся результат. И в правильных системах, вероятно, какую тематику ни возьми, определение тональности будет работать как влитое. Нельзя ли привести примеров, так сказать, только не поймите меня неправильно, вы же специалист. Вы же наверняка лучше меня знаете, что таких на сегодня нет. Поэтому никто и заявлений не делает. Кроме вас. на самом деле оптимизатор Давно уже нет. Хотя на Се-Тиме до сих пор пишу регулярно.
А Вы кто? Какую организацию представляете? По классификации Ашманова в этом треде я из тех, кто участвовал в РОМИПе «с жиру». Я случайно влез в IR, стало интересно, что-то получилось. Потому и. Никаких меркантильных интересов не преследовалось в принципе. Ерунду говорите. Как-будто Яндекс это такой абстрактный тяни-толкай. Яндекс это конкретные люди. А конкретные люди хотят зажигать и быть известными, публикующимися учеными, а не просто программистами, офисным планктоном, которых за пределами офиса никто не знает. Одно дело писать в своих блогах, а другое дело публиковаться и зажигать. Ну зажигать они и сейчас могут в каком-то объеме. Хотя поддержки от коллег разработчиков скорее всего не получат, у компании другие задачи. Вот доля по LI немного припала – все работают над этим. Наука подождет. И пока компания прибыльная, причем прибыль эта бодро растет с годами – правда на стороне руководства Яндекса. Вы воюете с ветряными мельницами Может и так. 4 дня в непривычном окружении на RCDL дались с трудом, нужно было куда-то выплеснуть. Мы и так знаем, кто круче в определении тональности. Это сомнительно. Пока никто не знает, я не исключаю, что какие-то потенциально интересные коллективы давно могли всех порвать, да только повода не было. Не все же умеют или желают это кому-то впаривать. Дорожка на РОМИПе – хоть какой-то повод для развития данной технологии в стране, и это гуд. Судя по вашим буквам выше, вы ведь пока не умеете определять тональность в общем случае, хотя все время утверждаете обратное. На самом деле вы определяете тональность только по малому набору узких тематик и ваши внутренние метрики наверное говорят, что определяется хорошо. Но шаг в сторону от знакомых тематик – и ваши алгоритмы начнут жестко косячить. Для определения тональности РОМИП полезен, т.к. подходов к этому определению больше одного. И конкуренция на дорожке может родить другие, до которых раньше не додумались, потому что поводов не было. В этом и есть большой теоретический плюс. Да и дальнейшее обсуждение того, что «мы тоже технологическая компания, вот в АОТе морфологию взяли» только подтверждает сказанное. Вроде Никита таких логических цепочек не выстраивал. Они сделали максимум возможного на их месте, нормальный, красивый, удобный разъём к ППБЯ с поиском ключевых слов и накоплением статистики. Выше по склону — стена, на которую им всё равно не влезть, но за 12 тыщ в месяц ничего больше требовать и нельзя Может и стена, хотя в целом это утверждение не только не верно, оно даже забавно. В этой отрасли наука пока слабенькая, во-первых, любой толковый студент может очень быстро освоиться на приличном уровне, а во-вторых – от освоения до вершины путь очень короткий. Посмотрите на работы ведущих гуру в IR – любому математику-студенту там понятно все и с первого беглого прочтения. Это не топология или теория групп, где только для понимания нужно несколько лет усердного учения. Поэтому сделать крутой прорыв могут многие, пришедшие со стороны и не зашоренные унылой кучей простых знаний. Такое может и у Бабоок получиться, чего только в жизни не бывает… Что касается РОМИПа — опять же, высказывание «поисковые машины у участников приличные», показывает, что вы не понимаете, что вам Тутубалин пишет про документы за пределами топа и неустранимый дефект вашей (РОМИПовской) методики в этом месте. «Приличность» поисковых машин только усугубляет этот дефект. Может, не надо в каждом посте так настойчиво употреблять слово «специалист» в отношении себя любимого? Вот Тутубалин — специалист, а про вас это из дискуссии пока не очень ясно. Дык, мы же не на научном диспуте, я стараюсь писать простыми словами и пользоваться аргументами, понятными большинству читателей треда. Никакого «дефекта» в этом случае нет, выше про это уже без меня написали. Публиковаться и зажигать — это (кроме чистого желания славы) — на случай смены работодателя, всё-таки. Работодателю тоже не помешала бы такая слава, но он по другому расставил приоритеты, на что имеет полное право. Проблема в том, что задача имеет мало отношения к реальности. Ну что это за задача — поиск по небольшой коллекции документов без внешних факторов? Корпоративный поиск? Поиск по одному сайту? Даже в этих случаях возникают факторы ранжирования и группировки, внешние относительно текста и на практике полезнее сгруппировать/отранжировать по ним, собственно текстовая релевантность имеет небольшой вес. А в интернетном поиске и вовсе рулят внешние факторы (ссылки и т.п.), clickstream, география, полнота и качество выкачки, борьба со спамом, наконец. Собственно текстовая часть поиска — только малая часть и давно решенная. Ну естественно, это малая часть, хотя и не решенная, даже на сегодняшнем уровне решений. Смысл текста начнет понимать только ИИ, когда-нибудь. Но до ИИ еще в семантику полезут, там пока непаханое поле. На сегодня, когда все решают проблему взвешиванием слов, некоторые методы только появились, например мои спектральные. Вот когда из них выжмется все, можно будет сказать, что на уровне взвешивания задача решенная, больше там некуда пойти. Большой поиск все такие малые части собирает в единое целое, они не всегда плюсуются, иногда одна корректирует другую. Но, если в какой-то из малых частей ваши технологии кому-то уступают, нужно как минимум спуститься с небес на землю. А как максимум – попытаться исправить положение, улучшая свои методы. В этом плане РОМИП помогает, т.к. все данные доступны и всегда можно проверить свои алгоритмы на данных РОМИПа, сравнив потом результаты. Некоторые так и делают, хотя в дорожках не участвуют по каким-то причинам. В этом еще один плюс РОМИПа. А я не про поиск. Уважаемый Гудман (не знаю, где уж он там специалист) по существу обсуждает на бытовом, в общем-то, уровне принципы тестирования систем распознавания, полноту-точность, матстатистику, прочее. Бытовой уровень выбран намеренно, иначе не поймут. «Текстовая часть поиска — давно решённая малая часть» — orly?? «ну какой я специалист», ааа, это многое объясняет +1
Я вам про РОМИП — вы мне про меня. Несколько раз про трусость, про непонимание, про то, что бывший специалист. Перечитайте свой пост, он же смешной: всё время попытки, как у гопников в подворотне, развести на «слабо». Вам сказать по существу нечего? На оценку личностей вроде не я первым перешел. Я влез в эту тему по двум причинам – во-первых, чтобы напомнить сообществу, что сейчас можно сделать независимую оценку определения тональностей в рамках РОМИПа, и, во-вторых, чтобы указать вам на некорректность ваших аргументов для вашей же оценки Бабоок. По обоим пунктам я подробно высказался выше. По первому все понятно, по второму — сама оценка может и верная, а может и нет, мне сложно сказать, я не в теме на сегодня. А вот аргументы – не годные. Ваша логика примерно такая: если компания А привлекает кучу именитых лингвистов и имеет успешные внедрения в лингвистических технологиях, а компания Б пока показала только пару студенческих работ, значит компания А однозначно круче компании Б в определении тональности. Логика странная, такие «значит» в отрасли не приняты, потому что они не опираются ни на какие метрики. Если бы вы сказали, что компании Б не реально получить долю, равную доле А, на рынке крупных корпоратов – вопросов бы не возникло, может оно и так. Но качеством определения тональности пока никто не мерился, поэтому все заявления про «мы круто определяем» выглядят как-то не серьезно. РОМИП — типичное УГ. Тех, кто там участвовал, я практически всех знаю — вижу на конференциях, слушаю рассказы про дорожки. Академические коллективы, использующие постоянно меняющихся студентов и аспирантов и вяло пытающиеся свою автоматическую классификацию продавать политикам и чекистам. Корпоративные поисковики, живущие милостью системного интегратора и вяло продающиеся раз-два в год. Яндекс как спонсор и буксир. Ну и так далее. РОМИП чаще спронсировался РФФИ, а не Яндексом, как мне кажется. С тем, что семинар последних лет был унылым – согласен, с УГ – нет. Все же интересные работы в малом количестве там бывали. И унылость не отменяет объективность оценок РОМИПа, научные конфы унылы практически всегда. Если Трек лучше, а наши местные не смогли сделать свой РОМИП интересным и полезным — это их проблема и ваша, а не моя. Вот вам и остаётся неуклюже пытаться взять «на слабо». Так вы не меряйтесь оценками качества своих технологий, если таких оценок нет, никто и не будет вас брать «на слабо». Но можно ведь и просто построить стада асессоров, чтоб получить объективную оценку своего качества. Такая оценка не обязательно будет объективна, особенно в крупной компании. Потому что ответственные за качество менеджеры всегда хотят создать удобные для себя метрики, убедить всех в их чудесности, а потом работать не над улучшением качества, а над улучшением своих метрик. Если внутренние метрики показывают, что все хорошо, а сравнение в рамках РОМИПа получается в пользу чужих методов от менее крутых коллективов, то в консерватории явно что-то не так. Для чего? Мы и так знаем своё место в этой технологической области. Тогда и не стоит заявлять, что ваше качество лучше того, что вы не мерили. говорить об этом нельзя, это военная тайна, мы вам тайно в переговорной из рук покажем слепые таблички… Я в третий раз напишу – таблички не слепые, все свои дорожки авторы давно показывают сами. попытка вызвать у меня даровой энтузиазм по поводу чужого дела Не, это попытка убедить вас не делать голословных заявлений при специалистах. Потому что выглядят эти заявления иногда забавно. Вот и вы с РОМИПом тоже, по-моему, не имеете аргументов кроме «а давайте вместе зажжём большой-большой костёр и будем петь под гитару пионерские песни!!!». Я в сентиментальных дорожках не буду участвовать, поэтому «а давайте» мне не нужно. Большее количество участников сделает дорожку интереснее, но мне-то что с того? Ну Яндекс-то тут при чём? Почему он должен зажигать? Он должен искать запросы и не пускать Гугл в Рунет. Я вижу, вы из тех, кто тут устраивает длинные унылые срачи про то, что у Яндекса гранаты, ну то есть научные статьи, не той системы. Как будто Яндекс — научный институт. Про гранаты из Яндекса срутся альтегэги (похоже, что их больше одного, типа две штуки), кто за ними прячется – мне не известно. Я обычно с этого ника пишу, прятаться ни к чему. Яндекс был одним из затейников РОМИПа, значит должен был зажигать, привлекая на семинар больше народа и стимулируя этот народ к креативу. Но Яндекс на это забил, как и все остальные затейники РОМИПа, которые так же забили. Что касается гранат или стимулирования отечественной науки, то Яндекс ничего не должен, я бы на его месте делал иначе, но позиция Яндекса в этом месте меня не сильно напрягает. Вопрос: как? Субъективно (сидит жюри и оценивает выдачу)? Или по какой-то формуле? Не сводится ли соревнование к угадыванию этой формулы или свойств жюри? Имеет ли эта оценка отношение к реальной жизни? Не сводится, альтерэга уже примерно объяснил. Оценки всем документам, попавшим в топ-20/50 выбранных запросов, ставят асессоры, уже после выполнения заданий. Хотя например в прошлом году часть из тестовых запросов была прошлогодняя, т.е. с уже имеющимися оценками. И все, кто обучал свои формулы на предыдущих оценках, получили существенный бонус. Тестовые выборки вполне достаточны, на TREC-е они похожи по объему, а результаты TREC-а считаются вполне достоверными (проще на TREC сослаться, чтобы в муть статистики не лезть). По одной коллекции оценивается несколько сотен запросов на глубину до 50-ти. Т.е. оценок на самом деле делается много, вполне достаточно для адекватного расчета метрик качества, которых в последний год считалось 18 штук. Ладно, пусть полнота выкачки — это трудный параметр. Он не трудный, он не интересный в рамках семинара, хотя и важный для реальных систем. нужны руки добровольцев на изрядной выборке в многие тысячи мнений. Ну и рабочее место для разметки, согласованный формат данных, процедура и софт для автоматической оценки. На поисковых дорожках все так и было. А размеченная эталонная база, в случае если эта разметка доступна участникам — тоже не имеет смысла т.к. обучаться будут по этим оценкам. Обучаются на оценках прошлых лет, текущих в это время еще физически нет. Предыдущему альтерэге: беда методики даже не в «100 запросов из 30к» (хотя и в этом тоже), а в том что из всей коллекции оцениваются только те документы, которые попали в топы. А которые не попали — никак не оцениваются. Чем меньше участников, тем больше таких документов и тем больше беда. Оценивается не 100 запросов, а больше. И по-факту беда такая имеется где-то на уровне погрешности, т.к. коллекции не большие (чуть меньше 5М документов на 2 штуки), найти не слишком сложно, а поисковые машины у участников приличные.
Прошу прощения за задержку с ответом, был на RCDL в Воронеже и тупо не хватило времени. Ну вот об этом и речь. Яндекс — лучший поисковик на нашем пространстве. Лучше Гугла, конечно. По какой метрике? По доле в LI или по выручке от рекламы – сегодня лучший. По метрике «количество букв G и O в домене» — лучшие Гугл и Гога. Вы бы определились, чтоле, с метрикой. И конечно, лучше всех, кто там суетится на дорожках. Если вы думали кого-то унизить словом «суетится», то не вышло. На последнем РОМИПе все участники поисковой дорожки (Яндекс, ИСА РАН и я) были значительно круче вас например по баблу (если жен в счет не брать). Так что в данном случае это вы суетитесь, походу. Т.к. не имеете внятных аргументов. А большие дяди в это время и не суетясь решают свои задачи, не всегда меркантильные. И что показывает «независимая оценка»? Что вот этого чувака с его обморочным как бы поиском , приготовленным специально для дорожки, надо взять в тот же Яндекс. Да, достойная цель. Для чувака. Независимая оценка может много чего показывать. Например то, на сколько хороши ваши методы поиска и ранжирования текстов. Если ваша боевая формула показала результаты хуже других – можно плющить соответствующих менеджеров. И что за поиск, «приготовленный специально для дорожки»? Как специалист в небольшом количестве из набора современных поисковых технологий, объясню бывшему специалисту – специально подготовить формулу, при условии случайной выборки из всего набора запросов для оценки, можно только в одном случае – если разметить все 30К выдач вручную, на глубину 50. Это экономически не выгодно, организаторы РОМИПа не создали семинару нужной репутации для таких затрат. Вот на TREC-е было выгодно, кетайцы там и больше размечали. Потому и размер поисковой дорожки TREC-а вырос до миллиона запросов. По-моему, хотят мериться «технологичностью» как раз те, кто меряется на РОМИПе. В силу иллюзии, что это важно. Мериться хотят все, кто в теме и кому важны оценки собственных технологий. Однако не все рискуют делать это публично, рассказывая сказки о недостойности такого занятия. Скажем, нам гамбургский счёт и так известен. Да он понятен и из статей на РОМИПе — как только произносится что-то вроде «а морфологию мы взяли на АОТ.ру». Это позиция гамбургского маркетолога, а не специалиста. Делать выводы по статьям годичной давности в IR специалист бы не стал. Слишком отсталая отрасль, дистанция от новичка до примерно равного в некоторых технологиях может быть пройдена быстрее, чем за год. Это доли медленно прирастают, и новые методы. Мериться технологичностью нужно для кого? Клиентам ваш РОМИП не нужен, он не является критерием выбора исполнителя. Тем более, что он анонимен. Клиенту не нужен, но будет использован конкурентом, который не побоялся выступить и выиграл дорожку. Потому что если клиент станет выбирать, то конкурент ему обязательно покажет свою медальку и намекнет, что некоторые забоялись мериться неспроста. И анонимности давно уже нет, де-факто. Ещё раз повторю: участие в РОМИПе — это академическая деятельность. Для участия в ней нужно тратить время разработчиков. Это можно делать в двух случаях: а) когда нечем больше заняться, то есть в случае академического коллектива или дохлой фирмы без заказчиков, то есть от бедности и от безделья; б) когда, как в Яндексе, есть куча лишних денег и сотня-другая человек с неопределёнными должностными обязанностям, то есть с жиру. Есть и другие случаи, например тестирование новых технологий. Если таковые вяло появлялись на РОМИПе – винить нужно в том числе и Яндекс, который не смог «зажечь» местную поисковую науку. На TREC-е новые технологии тестируются регулярно, некоторые из них оказываются удачными и потом используются тем же Яндексом. Ничего из реальных проблем реального поисковика в реальном грязном Интернете РОМИП не показывает и не обсчитывает. В частности потому, что надо же и остальных инвалидов как-то пустить побегать по дорожке. То есть ввести ограничения, которые позволят им асилеть тест. Почему не решает? Современный большой поиск состоит из совокупности технологий, часть которых можно обкатывать на скромных объемах РОМИПа. Если кто-то поставит себе цель добиться первенства во всех технологиях без исключения, то РОМИП как раз поможет. Семинары такого типа оценивают отдельные составляющие поиска, владение современными технологиями в этих составляющих не требует наличия всех умений и ресурсов Яндекса или Гугла. Заметим, что настоящую независимую оценку качества интернет-поиска Яндекс получает на наших анализаторах AnalyseThis.ru. И другого теста интернет-поиска — увы, в околоземном пространстве пока нет. Про «настоящесть» и «уникальность» — согласен. То, что хотя бы такие оценки кто-то делает – замечательно. К «независимости», декларируемой маркетологами, следует относиться острожно. Что касается метрик качества вашего сервиса, то например мне они не нравятся, но спорить об этом бессмысленно, альтернативу я пока предложить не готов. Нам, впрочем, ни тесты, ни их организация не нравились и раньше — унылые дорожки, неинтересные тесты на то, что было как бы модно три-пять лет назад. Скучные участники, которых видно только на конференциях и на РОМИПЕ, но не видно на рынке. На интересность дорожек можно влиять, если набраться смелости для публичного теста. Что касается видимости на рынке, то не все имеют в своих целях масштабную монетизацию. Некоторым она не нужна, другие не могут. Но новые технологии создавать способны. Что касается долей рынка, то мериться ими не всегда интересно. Этот рынок может очень быстро измениться, каким бы стабильным он не казался. Теоретический пример для рынка поиска – завтра ВКонтакте ставит у себя поиск Гугла и Дуров выступает с пламенной речью «поддержи ВКонтакте – используй только наш замечательный поиск!» Доли тут же изменятся. Или, если взять мониторинг и тональности – кто-то из вашик конкурентов запустит такую услугу в виде приложения в том же ВКонтакте, с похожими ценами, но еще и с услугой «мониторинг знаменитостей». «Свежие сплетни про Жанну Фриске» или «все последние косяки Путина» за 10 рублей в месяц. Доли в этой нишке тут же поменяются, в т.ч. и по баблу. Дорожка на двух участников: один занимает 1 место, второй — угадайте какое. А что ж там их не больше? Вероятно, что-то не так с дорожкой, да и с участниками. А что не так с участниками? Они-то в чем провинились, если организаторы не завлекли больше? Вредилка не выросла. Внезапно. Она отрастет с ростом конкуренции. Трек и РОМИП не влияют и не могут влиять, это скучные академические игры в неизвестно что. Технологии, успешно показавшие себя на TREC-е, бодро используются тем же Яндексом при вычислении факторов матрикснета. Вы предлагаете Гуглу и Яндексу записаться на дорожки РОМИПа или Трека, и потом победителя официально объявить главным поисковиком и передать ему все 100% доли рынка указом Президента РФ? При чем тут «доли рынка», «главный» и «президент»? На этих семинарах вообще все не про то, вы не поняли. В отдельных технологиях большие поисковики могли бы посоревноваться, например в текстовом ранжировании, чистке от спама или в поиске дублей. Но не будут, потому что боязно. В рамках РОМИПа ничего этого померить нельзя, потому хотя бы, что большинство участников ничего про поиск в Интернете не знают и не умеют. Откуда взялся такой забавный вывод про большинство участников?
Ой, да конечно. Да все эти авторитеты дутые, чо про них вуабще говорить-то. Да ладно, не все дутые. На примере бренда «Ашманов» многим в отрасли полезно поучиться. Вы бы лучше пояснили, зачем тем, кто работает на реальном рынке и с реальными клиентами, нужен РОМИП. С одной стороны, это не пиар (нельзя спрашивать, нельзя говорить, как у педиков в американской армии). С другой стороны, вон Никита всё-таки старается допустить утечку, чтоб, значить, это самое, всё же покрасоваться. Давно уже можно. Во-первых, если пролистать для примера доклады участников поисковой дорожки последних лет, то все показывают номера своих прогонов, публикуя при этом общие таблицы. Т.е. сразу понятно, где чьё добро. А, во-вторых, некоторые участники в своих докладах публично исследуют чужие прогоны, потому что всем это интересно. Например, в 2010-м Илья Тихомиров из ИСА РАН выяснил, что кто-то из участников поисковой дорожки не обучал свои формулы, получив при этом отличные результаты. Меня «пропалил». Что касается Никиты, то свои результаты никогда не запрещалось показывать, называя занятые по метрикам места. Никита показал свою технологичность с помощью независимой оценки, а вы нет, показав ему в ответ только большой лингвистический прибор с серверами. С другой стороны, это не сравнение конкурентов и не сравнение свойств продуктов. Чего себя сравнивать — чтобы знать, что на формальном тесте, придуманном умозрительно, ты лучше или хуже тех, кого на рынке нет или у кого система на реальных данных не работает? В поисковых дорожках в прошлые годы соревновались такие участники, что с ними вообще не очень есть о чём говорить, на самом-то деле. Это получение независимой оценки своих технологий. Что касается формальности теста, то правила дорожек не догма, любой желающий поучаствовать может высказывать свои предложения как по набору данных, так и по метрикам качества. И, показав унылые результаты на РОМИПе, потом будет сложно убедить специалистов, что есть какие-то «реальные» данные, и вот на них-то мы да, на них мы всех рвем! Если хотите меряться технологичностью – получите для начала независимые оценки. А если долями рынка и толщиной клиентов, то независимые оценки ни к чему, они ведь и навредить могут. Внезапно. Что касается участников поисковой дорожки последних лет, то можно посмотреть только на тех, кто получал лучшие оценки. Их не много, всего двое. Один из них, Саша Сафронов, после этого пригодился в Яндексе, а другой, гудман, благодаря РОМИПу основал новое направление в информационном поиске – спектральное. За которым большое будущее, зуб даю. Кроме академических возвышенных интересов, что предлагается как мотив затраты очень редких ресурсов разработчиков? Что касается шкурных мотивов, то они появляются только в том случае, когда есть чем пободаться. Вот Яндекс не показал ничего выдающегося в поиске на РОМИПе за последние два года, поэтому пришлось семинар на год прикрыть, открыв взад уже без поисковой дорожки.
watermelon , я подозреваю, что всех упомянутых в этом топике можно вычеркивать, может быть кроме бабоок, да и то сомнительно. Замечательным системам мониторинга честное и объективное соревнование противопоказано, потом ведь не получится запаривать авторитетом и прочими маркетинговыми фишечками.
Устроим показательный бенчмарк, не вопрос. Не, ваш субъективный бенчмарк не покатит, т.к. не сложно будет найти в нем косяки и съехать. Но можно устроить объективный, в рамках РОМИПа. Тем более, что как раз сейчас мы затеваем именно такую [URL=http://romip.ru/forum/viewtopic.php?f=28&t=922]дорожку[/URL]. Присоединяйтесь к обсуждению и участию, любой кипеш приветствуется. Если возникнут проблемы с публикацией первого поста на форуме РОМИПа — пишите админу, т.е. мне, адрес можно из профиля на Роеме найти. Участи в дорожке РОМИПа расставит всех по местам, хотя я сомневаюсь, что все сервисы, упомянутые в данной ветке, захотят участвовать. Ведь кидать маркетинговые понты типа «мы скупили 100500 лингвистов и все компании на рынке» куда проще… Про второе место из двух возможных в снипетной дорожке уже говорилось :) Я занял первое место из двух в той сниппетной дорожке, поэтому выскажу свое более весомое мнение про исследования Ингейта. Ингейт, в отличие от всех остальных компаний своей отрасли, показал, что он ведет какие-то исследовательские работы и не побоялся выставить их напоказ. Да, над статьями Ингейта можно иронизировать, но не стоит забывать, что это был первое их участие в РОМИПе. Но оно было, тогда как остальные компании на такой показ своих достижений не идут, видимо стремновато им.
не прав. Нужно предоставить по научному сотруднику выписку с места работы — института или универа или академии, нии. Можно, но они вроде проверяют иногда, т.е. левая выписка не прокатит. Зарплатная ведомость решает вопрос. Abbyy — это официальная околонаука? У Эбби в составе группы были как российские, так и зарубежные ученые, иначе бы грант не дали. Если вы проживаете а РФ и занимаетесь наукой, но в вашем коллективе нет человека, «осуществляющего научную и (или) преподавательскую деятельность в российском и (или) зарубежном образовательном и (или) научном учреждении», то в Сколково вас не возьмут, не зависимо от крутизны изобретений. Так же не возьмут, если нет «иностранного специалиста, который имеет значительный авторитет в инвестиционной и (или) исследовательской среде.» В кавычках — сколковские буквы из заявления на участие.
Сколково — не универсальный фонд, там финансируют новую науку, которая теоретически сможет окупиться в реальные сроки. Причем финансируются только коллективы из российской официальной околонауки (подтверждается не справкой, а зарплатными ведомостями), которые поддерживает какой-то западный великий научный гуру. У Перельмана нет окупаемости, у Сысоева нет никакой науки. Поэтому Сколково не для них.
Смотря по какому запросу, конечно. По какому еще запросу? В процитированном тобой куске есть слова «в среднем». elite отказался от влияния нефти на клики, т.е. клики на Директ все же были. А выручка за квартал — около нуля. Значит клики на Директ были практически бесплатны целых три месяца, в т.ч. на спец. Если бы так было на самом деле — все клиенты аптемизаторов свалили бы в Директ, в спеце CTR приличный, а денег платить не нужно. Цена на нефть убила бы всех аптемизаторов с их ссылками и накликами.
elite, стоимость среднего клика около нуля — это конечно сильное утверждение, но оно ведь легко проверяется. На Роеме тусит куча спецов по контекстной рекламе. Ты думаешь, они подтвердят, что в конце 2008-го платили в среднем пару центов за спец. размещение в Директе?
Следовательно можно восстановить 4 квартал. Чтобы сходилось. Получается, что выручка за 4 квартал около 0. Падение до нуля — это падение больше, чем падение нефти. Раз выручка за квартал около нуля, то кликов на контекстную рекламу не было. Целый квартал. Ну или «около не было». Ведь там за каждый клик центы какие-то плюсуются, стопудово. Значит цена на нефть влияет на клики по Директу!
Волож (в смысле — Яндекс) не «играет» на бирже, у него другая роль, он эмитент И это никак не мешает Воложу, как бизнесмену, сыграть через другую компанию в короткую. Хотя в данном случае этого точно не было. Да, G00DMAN, вы будете явно удивлены, но эмиссия акций — в аспекте денежных потоков — эквивалентна «игре в короткую». Вовсе нет, эмиссия (как первоначальная при открытии АО, так и дополнительная) эквивалентна «покупке», точнее это не покупка а «изготовление», если по простому. Продажа эмитированных когда-то акций (не важно когда) — это закрытие длинной позиции, фиксация прибыли. Возвращаясь к Яндексу, получается, что он и не «играл», и «позиция» у него не «короткая», а при обратном выкупе акций он, тем не менее, зафиксирует прибыль. Позиция у Яндекса не короткая, а длинная, по тем акциям, которые он еще не продал. При обратном выкупе объем длинной позиции вырастет, никакой фиксации прибыли при этом не произойдет. Вот уж кому — этим фондам — точно никто не помешает купить себе обратно «немножко Яндекса», тем самым возвратив себе контроль над хорошим активом (про который они всё знают, и с которым все отношения налажены) и изрядно при этом «нагреться» финансово. Контроля в тех акциях, что крутятся на бирже вроде мизер, если я не ошибаюсь. Т.е. их выкуп никакого контроля особо не добавит. Изрядно «нагреться» получится только при росте котировок, аднака. Рост пока не очевиден, не следует забывать о «купившему дно — второе дно в подарок!»
megapinion, у вас какая-то каша в голове. В одном абзаце вы утверждаете, что продажа акции это фиксация прибыли, на 5 строчек ниже — что покупка Яндексом по 15 это фиксация. Вы бы определились, чтоле. На самом деле продажа фиксирует прибыль не всегда, а только если была открыта длинная позиция, на покупку. Аналогично — покупка будет фиксировать прибыль, если была открыта позиция на продажу. Т.е. если Яндекс купит по 15, фиксируя прибыль, значит Аркадий играл на понижение, у него была открыта короткая позиция.
О, пацанский жаргон 21 века внезапно доставил. Кукарекус. На сленге того же века, Rasklad — тебе плюсадын. Ида, Rasklad, за 675 рублей кипеш поднимать как-то западло, внатуре.