Abbyy показало проект смыслового переводчика Сергею Голубицкому

Развитие событий: Сергей Андреев, ABBYY: В кризис рынок IT сокращается одним из первых (23 марта 2015)

Начну с лапидарного компендиума: Compreno - это технология перевода любого человеческого языка на универсальный язык понятий. Соответственно, Compreno включает в себя и сам этот универсальный язык понятий, который ABBYY 15 лет (тайком ☺ разрабатывала в своих исследовательских лабораториях.

Результат ошеломляет: Универсальная Семантическая Иерархия (УСИ) - ядро языка понятий - насчитывает сегодня 60 тысяч элементов в универсальном разделе когнитивной модели, 80 тысяч - в русском разделе, и 90 тысяч - в английском! Ничего даже отдаленного в мире не существует.

596_samples.jpg

Источник

Комментарий Roem.ru: Андрей Анненков практически о том же самом писал в "Науке" еще в прошлом году. Удивляет, что в обоих случаях никто не пишет о том, как ему дали самостоятельно попереводить текст при помощи Compreno.

Лучшие комментарии

Добавить 358 комментариев

  • Ответить
    Игорь Ашманов Сам себе компания

    Удивляет недеццкий уровень зомбирования при показе. Голубицкий, видимо, испытал множественные пароксизмы и весь пропотел от восторга. Слова типа «ошеломляет», «величие» и прочие превосходные степени просто выпрыгивают из текста. В реальности же ему показывали в основном слова. Про количество вынутых кубокилометров породы: 15 лет, шесть этажей, 70 миллионов долларов, сотни людей. И «скоро всё будет». Примеры отдельных предложений, конечно, ни о чём не говорят. Даже если бы ему была дана возможность переводить самому по одному предложению, это тоже не очень сильно помогло бы пониманию возможностей системы, потому что такие случайные «тестировщики» вводят обычно очень короткие и простые фразы, на большее у журналиста не хватает терпения и выдумки. Когда в сети появится окошко для вставки текста, тогда и поговорим о качестве. Может, мы даже сделаем свой анализатор.

  • Ответить
    Альтер Эго

    потому что такие случайные «тестировщики» вводят обычно очень короткие и простые фразы, на большее у журналиста не хватает терпения и выдумки. Я помню в давние-давние времена когда группа ученых из ВЦ поехала в братский НИИ в Монголии показывать им наш распознаватель речи вокруг него толпилась большая толпа местных ученых которые тестировали наш распознаватель на -х.й -п.зда -.б твою мать

  • Ответить
    Игорь Ашманов Сам себе компания

    Да, я сообразил, что мне это напоминает! Great! Insanely great! Just amazing, amazing, amazing, amazing, amazing, amazing, amazing, amazing!!! UN-BE-LIE-VABLE!!! Merely incredible, incredible, incredible,incredible, incredible,incredible, incredible!!! Incredible,incredible, fantastic, fantastic, fantastic, fantastic, fantastic! Terrific, terrific, terrific, terrific, terrific, terrific, terrific, terrific, terrific, terrific!!!!!!!!!! http://www.youtube.com/watch?v=1ZS8HqOGTbA But Jobs, you know, that guy really delivered.

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну да, они отделили его в отдельную компанию. Если они потратили $50М за 15 лет, при этом там сидит минимум 300 человек с офисом, техникой, зарплатой и налогами примерно на $3000-4000 в месяц на одно лингвистическо-программистское рыло, то получается, что в последние годы они тратили на проект Компрено где $10-12М в год. Следовательно, 475 миллионов рублей (это где-то $16М) — это бюджет примерно на два года, максимум. И это при том, что теперь всё жизнеобеспечение проекта (офис, техника, бухгалтерия, сисадмины, трафик, охрана, питание, страховки) уже не поставляется материнской компанией Абби, а должно быть по идее своё, самостоятельное. А эти два года пошли считаться, наверно, где-то с осени. А что произойдёт дальше? Вряд ли с ещё не выпущенным продуктом на начало 2012 они выйдут к концу 2013 на продажи в $10М в год (или $800 000 в месяц). Есть, конечно, возможность очень крупного ОЕМ-контракта с каким-нибудь Яндексом или Самсунгом (показали волшебную технологию, поставили в каждый телефон, получаем роялти), но у таких контрактов очень длинный цикл продаж. Значит, далее — следующий раунд инвестирования. Неизбежный.

  • Ответить

    Ребята, если какая-то компания, которой я руковожу, однажды выдаст пресс-релиз со словосочетанием «результат ошеломляет» — прострелите мне коленку, пожалуйста. У меня все, спасибо.

  • Ответить
    Альтер Эго

    Ashmanov, а как подобные проекты закрываются? Только после потери доверия инвесторов или у самих тоже мужества может хватить признать поражение?

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну, они не всегда закрываются. Зависит от конфигурации всей конструкции «визионер + инвестор». Например, Квинтура по сути закрылась,потому что деньги давали одни люди, а кричали «мы убийца Гугла, у нас новейшие секретные технологии, у нас одних патентов на сто мульёнов!» — другие люди. То же самое было с Тор4Тор — придумали социальную сверхплатформу одни, а давали бабки другие. Ну вот денежные краны и закрывались в определённый момент. А бывают другие случаи, когда деньги даёт или поддерживает проект собственно основатель компании. То есть источник высокотехнологического пиара и источник денег практически совпадают. Конечно, основателя обычно грузят великой идеей какие-то другие люди, но они — рядом, они свои, соратники, они с самого зарождения компании, они умеют польстить и зажечь и т.п. Это как раз случай Абби. Мне кажется, их проект не может закрыться, потому что он прямо привязан к ощущению себя гением у основателя Абби. Им был нужен следующий великий проект после успешного Finereader и неудачного Cybiko (вот очень похожая восторженная статья Козловского про Сайбико в той же самой Компьютерре: http://www.computerra.ru/mobilis/7149/). Но вот выделиться в прямую компоненту, в отдельную подводную лодку, да ещё на государственный грант, что гораздо безопаснее с точки зрения бизнеса — он может. Такой же великий проект вёлся в лаборатории Касперского, сначала он назывался «Прага» (потому что Каспер в конце 90-х съездил с разработчиками вшестером в Прагу и там под пиво в отеле придумали Новую Великую Архитектуру). Ребята фактически изобрели заново CORBA или COM+, но мне кажется, они просто про них не знали на тот момент, да и зачем нам чужое, когда мы сами очень крутые и умные! Эту «Прагу»делали лет семь-восемь, она сожрала несколько миллионов долларов. Потом она мутировала и стала называться ЕКА (единая компонентная архитектура). Насколько я знаю, в конце 2000-х эту ЕКА в ЛК навязывали всем, кто делал и выпускал реальные продукты, а они отбивались. Опять-таки причиной написания этой общей шины было желание лично Касперского видеть себя великим технологическим визионером, который делает уже не просто известный всем антивирус, а что-то Новое, Великое и максимально Общее. Параллельно там в ЛК делали и новую безопасную операционку (типа, втроём). Вряд ли этот проект может умереть или быть закрыт, он будет и дальше мутировать. А бывают ещё более другие случаи, когда деньги вообще государственные, академические, учреждение научное, так что проект длится не 15 лет, а все 30. Есть такие примеры как раз из той же области прикладной лингвистики и МТ: — проект переводчика Этап» в ИППИ РАН под руководством академика Апресяна; — проект переводчика в ВИНИТИ под руководством проф. Белоногова. За это время были защищены неисчислимые кандидатские и докторские, написаны сотни статей и докладов, худые вихрастые юные аспиранты превратились в заматеревших седых профессоров со своим выводком кандидатов и аспирантов, их дети влились в проект в роли юных аспирантов и т.п. А технология так и не заработала. И ничего, и ничего, и ничего, и ничего. На Западе, впрочем, на академический ИИ было потрачено ещё больше и там проекты тоже длились по 20-30 лет. Понятно, что когда «статистический Гугл», сделал плохой статистический переводчик для всех языков, но за три года — это же неправильно, обидно и ненаучно. Вот прикольная цитата из идола наших прикладных и теоретических лингвистов, живущего в Канаде профессора Мельчука, которому сильно за 70 (на основе теорий которого, очень условно говоря, сделаны и Этап-3, и Компрено): Гугл, например, сделал десятки систем машинного перевода для очень многих языков; и если, например, речь идет o китайском языке, то в переводе все-таки выныривает нечто, что можно понять, хотя бы про что говорится. Однако текст перевода читается с ужасным трудом. А мне понятно, где у них беда и как это поправить. Поправить это легко, по сравнению с тем, что они уже сделали. Я пытался написать в Гугл. Речь идет не о деньгах, я их ни о чем не прошу — мне достаточно, чтобы со мной один раз поговорили, хотя бы по скайпу. И я им посоветую, как что исправить. Это 5 человек могут сделать за пару месяцев для одного языка. Они же отвечают, что им это не нужно. То, что они сделали, и так хорошо. Абсолютно честный ответ. Заведует этим информатик-кибернетик, который и слышать про лингвистику не хочет. Зачем ему? У него и так получается, ну, можно немножко лучше — но для него это разницы большой не представляет. Это все по-человечески совершенно понятно. Он сидит на хорошем месте, получает хорошую зарплату и делает вполне приличную работу. Зачем ему связываться с кем-то, чье имя и не выговоришь толком?

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну и добавлю, что в некоторых таких случаях у меня бывает мысль, что может, я просто дурак и чего-то не понимаю, а ребята сделают-таки великое. Кто его знает…

  • Ответить
    Игорь Ашманов Сам себе компания

    Не, я всё-таки дурак: http://www.wired.com/dangerroom/2012/02/dmitry-itskov/ Магнат русской интернет-прессы Дмитрий Ицков за 35 лет планирует пересадить человеческое сознание в робота. Это прямой путь к бессмертию. По-моему, Абби — жалкие приземлённые программисты, склонные быстро выпускать неинтересные, скучные продукты.

  • Ответить
    Альтер Эго

    Прямо перед выборами жулики от власти при помощи жуликов от журналистики решили рассказать народу о том, как они строят сильную Россию, на народные деньги поддерживая жуликов от науки. Наглядо демонстрирующая, кстати, чем слово «жулик» отличается от «вор». Интересно, кстати, как отличаются эти слова в ошеломляющей семантической иерархии.

  • Ответить
    Игорь Ашманов Сам себе компания

    Не надо высосанных из пальцев дежурных наездов. В Абби — не жулики. Они верят в этот проект. Иначе бы не вложили сначала сами 15 лет труда и 50 лямов грина. Это мы здесь можем их подкалывать по-свойски за гигантизм и шапкозакидательство, но для Сколково это совершенно нормальный проект. Потому что: а) туда ломанулось довольно много слабых, малахольных или дутых проектов; лезут шарлатаны и жулики, на их фоне Компрено — сияющий Эверест; б) в Сколково ничего не пилят (если вы не в курсе), там жесточайший контроль; да и денег жуликам в среднем всё-таки не дают; в) там работает нормальная венчурная схема, то есть из 10 проектов выстрелят в лучшем случае 1-2. Как всегда. В Европе и США государство, университеты и венчуристы ежегодно тратят многие-многие миллиарды на гораздо более мракобесные и малахольные проекты в хайтеке, потому что никогда не знаешь, что выстрелит. Хороший пример — DARPA, которая даёт бабки на такое, что волосы на лоб лезут. Ну уж про фундаментальную науку нечего и говорить, она вся такая: после того, как недооценили ядерных физиков в начале ХХ века, теперь дают бабки на что угодно. А такие проекты, как Компрено, и должны делаться на государственные деньги, потому что если даже заявленная технология не заработает (что для околонаучной деятельности обычное дело), то сотни бывших студентов и аспирантов будут приобретать опыт работы, знания и т.п. Абби, кстати, и сейчас одновременно пылесос кадров и фабрика кадров. Просто для коммерческой компании такой проект — дело непосильное. Никакой маржи не хватит.

  • Ответить
    Альтер Эго

    чооорт. не получилось сделать из Ашманова оппозиционера. как мне теперь отчет в госдеп писать? свяжусь-ка я с Голубицким, он же ж омериканец почти что, он поможет.

  • Ответить
    Альтер Эго

    >> Не надо высосанных из пальцев дежурных наездов. Не, ну понятно, что ссориться с ABBYY не очень разумно. Но одно дело веровать в успех проекта, а другое — инициировать написание таких статей. Куда катится мир? Одна крупная интернетовская фирма продвигает себя, рассылая пользователям троянов, другая крупная фирма продвигает себя, организуя презентации специально для Голубицкого… Беспредел.

  • Ответить
    Игорь Ашманов Сам себе компания

    Пиар — дело вполне законное. Даже если это демонстрация одному легковерному журналисту. Какая, казалось бы, разница. Но пиар ДО выпуска продукта, чем Абби, по-моему, грешит уже полгода,это путь к краху. Потому что это такой верный признак проектов второго рода, пузырчатых.

  • Ответить
    Альтер Эго

    А вот тут помогли бы публикации о которых Ашманов говорит, что они не нужны. Сергей Брин и Ларри Пейдж до выпуска своего поисковика писали и всем было понятно, чем они занимаются. Проблема которую хочет решить Абби состоит из тысячи подпроблем очень сложных и важных. Если бы они публиковали последние 15 лет как они решают подпроблемы, всем было бы ясно, что ребята серьезные, дело идет и есть шанс, что что-то строят. А нет публикаций — ясно, что ничего у них нет. «Готовим сюрприз». И им самим важно. Когда строишь какую-то систему большой группой, то неизбежно погрязаешь в закрытых обратных связях, которые приводят к тому, что трудно оценить то ли разрабатывается, можно ли сделать лучше и вообще придет ли это к чему кроме повышения метрик внутри системы (а также продвижения по должностям сотрудников повязанным к этим метрикам). А открытое обсуждение подрезультатов могло бы решить делается ли что-то правильно, надо ли что-то решать или это уже решено, а может и решать не надо.

  • Ответить
    Игорь Ашманов Сам себе компания

    А причём здесь разговор про публикации? Мы тогда обсуждали лишь, что если у компании большой бизнес, прибыль и много пользователей, то оценивать её по публикациям — глупо, нужно по обороту , доле рынка и курсу акций. Публикации нужны программистам в видах смены места работы, а не акционерам. Но публикаций из проекта Компрено действительно не исходит. Возможно, в Абби строжайше запрещено писать про технологию, пока не. Впрочем, супернаучному, несекретному, публичному проекту Этап-3 в ИППИ, за 30 лет выпустившему гору публикаций, публикации не помогли. Вот здесь: http://www.ai-conf.ru/programm2012 был разработчик из Абби, мы его потерзали, конечно.

  • Ответить

    А открытое обсуждение подрезультатов могло бы решить делается ли что-то правильно, надо ли что-то решать или это уже решено, а может и решать не надо. Ну так мы бы и начали «открытое обсуждение подрезультатов» — если бы нам показали эти самые подрезультаты — а не несколько кадров из презентации в сопровождении восторгов Голубицкого.

  • Ответить

    Инвесторов жаль, они не понимают, что проект не выдержит конкуренции с грядущей технологией, которой вообще по барабану с какого языка на какой переводить и которая на порядок опережает по своим возможностям все, что успели наработать в Абби.

  • Ответить

    «Возможно, в Абби строжайше запрещено писать про технологию, пока не.» Технология светилась в сети на форумах по ИИ. И прорыв в этом направлении уже явно виден. Абби просто не обладает достаточными динамически изменяющимися базами коллекций запросных графов, чтобы составить конкуренцию поисковикам, и понятно, что никто им эти базы сливать не будет.

  • Ответить
    Игорь Ашманов Сам себе компания

    Инвесторов жаль, они не понимают, что проект не выдержит конкуренции с грядущей технологией, которой вообще по барабану с какого языка на какой переводить и которая на порядок опережает по своим возможностям все, что успели наработать в Абби. И единственное отличие — что на данную грядущую технологию пока не дают деньги неразумные инвесторы?

  • Ответить

    Игорь, инвесторы, они же такие же как ты, бизнесмены чисто типа, они не могут строить аналитику на инсайдах типа тех, которые просачиваются. Слишком косвенным образом она сливается. Нужно действительно понимать технологию, чтобы узреть в этой всплывающей инфе охрененный риск. Вот взять, к примеру вас…и что, вложились бы вы в Абби? Скорее да чем нет, просто вас в Абби никто не ждет :) И ваши реплики в их сторону лишь доказывают интерес к ним…:) Тем не менее, этот проект умрет не родившись…(с) Но вы, как инвестор, не можете понять это, хотя и обладаете в данной специфической теме некоторым набором знаний (изрядно устаревщих :) )

  • Ответить
    Альтер Эго

    «Заведует этим информатик-кибернетик, который и слышать про лингвистику не хочет.» Вы будете смеяться, но она в данной технологии вообще участия не принимает. Именно поэтому все равно с какого на какой язык переводить. Если кратко, то суть технологии в следующем: Берется ПОЛНЫЙ запросный граф в 3D на одном яыке и такой же запросный граф на другом языке, смотрится конструкция выражения в нем, выраженная в координатах данной фразы и коррелирующих с ней, а потом просто ищутся похожие геометрические конструкции в другом графе. Самая похожая геометрическая конструкция и есть смысл этой фразы на другом языке, а семантическое ядро этой конструкции (обладающее минимальной суммой расстояний между всеми ребрами в этой конструкции) и есть искомый перевод нужной фразы. Так вот о какой конкуренции с поисковиками тут может идти речь со стороны какой-то там Абби??? Смешно, но для инвесторов не очень…Вот из чего инвестор должен исходить, но такими тонкостями инвесторы не обладают, правда Игорь? Или вы рискнете сказать что знали об этом? :) P.S. Надеюсь, никого не обломал :)

  • Ответить
    Альтер Эго

    Ашманов как обычно пишет свое мнение о том, в чем он давно не разбирается. И Прага и EKA являются работающими технологиями, а не какими-то мертворожденными проектами, на которые потратили кучу денег по непонятной причине. Прага, к слову, портирована на unix (и используется в юниксовых продуктах), чего в случае с COM нет и не предвидится. Никакого «мутирования» их праги в еку не было, все писалось заново, т.к. прага была спроектирована достаточно давно и не использовала современных возможностей С++.

  • Ответить
    Альтер Эго

    Зато Ашманов прекрасно понимает перспективы переводчиков и особенно их мобильных приложений…Это взорвет международный рынок труда и поставит мировую экономику в совершенно новые условия. Ашманову очень хочется залезть в эту нишу и он с радостью будет финансировать Абби…Вы не смотрите что он их тут чморит…:). Да и нужно ли ему сегодня много знать? :) Там еще много нюансов в этой технологии и проблемы, требующие решений. В конце концов, парсить запросный граф можно беспрепятственно и сейчас. Закрыть эту возможность поисковикам нельзя, т.к. она привязана к рабочему функционалу контекстной рекламы. Я даже больше скажу, в паблике уже сегодня есть решения, которые это позволяют делать любому желающему. Парси не хочу.

  • Ответить
    Игорь Ашманов Сам себе компания

    Не надо за меня фантазировать. Я совершенно не хочу инвестировать в Абби. Ни копейки не дал бы. Потому что достаточно знаю про технологию и знаю людей. Но я совершенно не против того, чтоб их инвестировало государство или Ян лично.

  • Ответить
    Игорь Ашманов Сам себе компания

    Про ЕКА прикольный пост. Явно аффтар поста из тех, кто грузит Каспера великими новыми идеями. Обычно это такие хитроватые перцы в возрасте под 50 или даже за 50, с плохими перспективами на рынке труда, но зато ходящие с Каспером в качалку, в баню и на горнолыжные курорты. Вам сколько лет, уважаемый? «Она мутировала» — это имелось в виду, что мутировали инструменты интриг: сначала Каспера грузили Прагой, потом операционкой, потом ЕКА. Мутировали интересы, мутировали группы, которые боролись за влияние на Каспера. Но вы делайте, делайте великие технологии. Переносите их под Юникс! Я уже могу себе позволить в 2012 перестать в этом разбираться. И вообще забыть о вас наконец. К счастью, теперь вы с вашим великим бизнесменом-основателем перестали быть у меня дома каждоутренней темой для разговоров за завтраком типа «Знаешь, что эти идиоты опять вытворили? — Да не может быть, вот это жесть!». Кошка бросила котят. Попутного вам ветра, великие программисты.

  • Ответить
    Альтер Эго

    И только на Роеме в обед можно наконец выдохнуть, и поговорить о том, что действительно интересно, правда?

  • Ответить
    Альтер Эго

    Ну что вы , Игорь, какие фантазии? Можно подумать у вас есть альтернатива в этом векторе инвестиций. Кстати, вы недавно отказались инвестировать в проект, который вполне мог бы развиться в переводчик, поскольку проект как раз парсит запросный граф Яндекса. Что, коммерческая хватка уже не та стала? Врядли. Просто вы не связали эту возможность с темой перевода. О каких знаниях технологий у вас после этого может идти речь? Не смешите. :) Игорь, никто от вас этих знаний и не требует, успокойтесь, просто некоторых раздражает как вы тут на роеме создаете видимость их обладания :) Ну а так, если по чесноку, то ваши высказывания «не дам Абби ни копейки» выглядят убого и смешно, ну кудыж вы денетесь то? :). Вкладывать-то надо куда-то, а альтернативы у вас нет. Хватайтесь за Абби, пока поезд не уехал. :) Это беспроигрышный вариант, выхлоп при таких раскладах все равно будет, ну, не такой, как вам бы хотелось, конечно, но в убытке не останетесь.

  • Ответить
    Игорь Ашманов Сам себе компания

    Кстати, вы недавно отказались инвестировать в проект, который вполне мог бы развиться в переводчик, поскольку проект как раз парсит запросный граф Яндекса. По-моему, у вас галлюцинации. У меня действительно идёт поток проектов в стиле «Общая теория всего». Где-то 2-3 раза в месяц. Это обычно интеллектуальные системы, которые после их реализации позволят буквально всё: переводить с любого языка на любой (обычно они ещё и языково-независимы!), распознавать речь, генерировать текст, поддерживать диалог, в общем все интеллектуальные функции человека, ну и поисковик круче Гугла… Например, у меня в шкафу лежит сорок страниц текста, озаглавленного «Система исчисления смыслов». Часто их авторы ещё и дарят на встрече книги типа «Смысл жизни», «Вселенная», «Смысл». Потому что они уже стали к своим 40-50 офигенно мудрыми. Но вашего великого проекта не помню. Мне кажется, вы продолжаете фантазировать. Текст какой-то про парсинг чего-то в Яндексе наверняка приезжал, таких текстов приходит 1-2 в месяц. Вкладывать-то надо куда-то, а альтернативы у вас нет. Во-первых, вы меня с кем-то перепутали, я не венчурный инвестор и денег у меня на ваши великие стартапы — нет. Передайте это всем своим великим изобретателям. Во-вторых, альтернатив для запуска стартапов у нас хватает. У нас сейчас есть проект по виртуальным собеседникам, домашним роботам, анализ мнений в Интернете для русского, английского и арабского, анализ грамматики русского и прочих языков, вьетнамский поисковик, поисковик с извлечением фактов и отношений из веба, веб-фильтр для русского, английского и вьетнамского, контекстная реклама для азиатских языков, …. Безумных изобретателей общих шин и общих теорий всего — не надо. Идите к Ицковичу, за электронным бессмертием и деньгами.

  • Ответить
    Игорь Ашманов Сам себе компания

    А, вспомнил, был тут какой-то одержимый, рисовавший карты в виде беспорядочных множеств точек на координатной прямой, где неизвестно что по осям. Да, было такое. Ну и как переводчик, уже переводит? А парсер — парсит? Или опять неумные инвесторы виноваты, не дают бабла на гениальную идею?

  • Ответить
    Альтер Эго

    Игорь, вы опять чего-то напутали (и не мудрено). Во-первых мой проект обошелся без ваших средств и нашелся другой инвестор, правда парсинг и построение графа используется там для других задач. Во-вторых, я понимаю, что у вас это больная тема, но не надо так нервничать. Ваш поезд в моем лице от вас уже ушел, я просто советую вам не пропустить следующий с Абби :) И не надо тут впаривать, что проект Абби вам как инвестору не интересен. Речь шла лишь о ваших устаревших знаниях в предметной области, которые не позволяют вам грамотно инвестировать в данном направлении, вот и все. Зачем поносить проект Абби и при этом бредить об инвестициях в него? Ну все же на виду Игорь…ну аки мальчишка ей Богу ну… Ида…парсер парсит, граф строится… «А, вспомнил, был тут какой-то одержимый, рисовавший карты в виде беспорядочных множеств точек на координатной прямой, где неизвестно что по осям. Да, было такое.» Да, тяжка ваша доля…:) :) «Но вашего великого проекта не помню.» А мой проект был не велик, к тому же уже работал и выполнял вполне конкретную задачу. Строил Граф яндекса, я предложил инвестировать в построение графа под гугл. Про переводчик вообще не упоминалось. Была другая схема монетизации, вполне себе конкретная. И сказал, что если вы не заинтересуетесь, то в очереди уже есть люди, вот и все. За вами я не бегал если чо. Я просто тупо написал письмо и проконтролировал доставку пакета. Ответа не последовало, ну и все собственно, а чо :) Не надо так не надо. Просто я опять к тому, что если бы у вас была хоть толика современных знаний в области технологий перевода, то вы бы ухватились за мое предложение увидев в нем реализацию именно в этом качестве.

  • Ответить

    Магнат русской интернет-прессы Дмитрий Ицков за 35 лет планирует пересадить человеческое сознание в робота. Это прямой путь к бессмертию. Я, кстати, не сразу, но осознал этот проект во всем его величии. В качестве первой фазы — сознание роботов пересадят людям. А дальше — все уже просто. И процесс уже идет полным ходом.

  • Ответить
    Игорь Ашманов Сам себе компания

    Игорь, вы опять чего-то напутали (и не мудрено). Во-первых мой проект обошелся без ваших средств и нашелся другой инвестор, правда парсинг и построение графа используется там для других задач. Ну ясно, путаю. Это от невежества. И потому что я не понимаю вот этой фразы: Кстати, вы недавно отказались инвестировать в проект, который вполне мог бы развиться в переводчик, поскольку проект как раз парсит запросный граф Яндекса. Что, коммерческая хватка уже не та стала? Это не про ваш величайший проект было сказано?

  • Ответить
    Игорь Ашманов Сам себе компания

    А, точно, это про него. Конечно же. «Парсинг запросного графа Яндекса» — ну конечно же, это будущий гениальный переводчик. Ну так вы же нашли инвесторов. Это сеошники, правильно я угадал? Ну и делайте переводчик на их деньги.

  • Ответить
    Альтер Эго

    Игорь, я устал повторять, мой проект, который вам не показался интерсным (по причине вашего невежества в технологии перевода, которой пользуется Абби, а также по причине отсутствия интереса к той модели монетизации, для которой он создавался) живет своей жизнью, выполняет свои задачи и в своей нише пиарится. У проекта совсем другое предназначение. И я не хочу развивать проект в сторону переводчика, понимаете? Меня еще нужно уговорить этим заниматься. А что не понятного в фразе то? Давайте по частям тогда разбирать (я вас полюбил я вас научу: Смысл целой фразы следует понимать после осмысления ее составляющих.) «отказались инвестировать в проект, который вполне мог бы развиться в переводчик» Незнание технологии перевода, которая обозначена в этой ветке недвусмысленно и внятно, не позволило вам уцепиться за имеющийся в проекте функционал парсинга и построение запросного графа. Вы тупо не увидели в этом функционале пользы для интересующей вас проблемы перевода (как и сейчас не видите бесперспективности во вложение в Абби, которая не сможет конкурировать с поисковиком по качеству построения графов). Тут все ясно? :) «Что, коммерческая хватка уже не та стала?» А это уже глум, Игорь. С хваткой-то у вас все нормально слава Богу. А вот с технологиями у вас явные проблемы. Абби могут выстрелить раньше поисковика, при определенных условиях (если гуглоиды или яндексоиды тормознут), о которых вам также ничего не известно (опять таки по причине незнания технологии да еще и в деталях). Там большие проблемы и я не рискнул бы их решать без соответствующей команды. Да даже с командой я бы, пожалуй не рискнул, потому что проблема связана с эволюционными процессами матрикснета и подобного у гугла и зависеть от них при разработке собственного проекта-это как сами понимаете для разработчика не комильфо, а для инвестора это офигенный риск. Опередить Яндекс или Гугл в этой узкой задаче, являющейся основным камнем предкновения — НЕВОЗМОЖНО. На данном этапе развития обоих поисковиков, у которых в запросном графе слишком много дыр и которые они не могут и не смогут склеить не набрав соответствующей статистики еще несколько лет, НЕ ПОЗВОЛЯЕТ надеяться на сколько нибудь быстрое коммерческое решение, которое действительно будет адекватно и порвет рынок. То, что может получиться из текущего состояния дел НЕ ДАСТ ожидаемого инвесторами результата. А когда придет время и статистика будет набрана, ни Абби, ни кто то еще не опередит их на повороте. А ваше пресловутое окошко с вводом текста будет бесплатным…Надеяться здесь можно только на подхват…на непосредственную близость к созданию мобильных приложений и на интеграцию своих наработок с гигандами.

  • Ответить
    Альтер Эго

    > по причине вашего невежества в технологии Здравствуйте, пиццот какая-то инкарнация tar729 (или какой он там по счету)

  • Ответить
    Альтер Эго

    основным камнем предкновения являют гиганды и ни кто нерискнет склеить дыр в запросном графе на повороте.

  • Ответить
    Альтер Эго

    > Явно аффтар поста из тех, кто грузит Каспера великими новыми идеями. Не угадали, к архитекторам Праги или ЕКИ я не имею никакого отношения. Я их просто использовал в работе. Основная ветка продуктов УЖЕ сделана с использованием EKA, а предыдущие были с деланы с использованием Праги. Это не мифическая «общая шина», а вполне реальный набор библиотек, нужных разработчику. В них возникает необходимость, когда продукты вырастают до определнного уровня и начинают делиться на большое количество независимо разрабатываемых компонентов, которые как-то должны работать вместе, и все это должно работать на разных платформах. Вашу точку зрения понять можно — насколько я знаю, вы продуктов такого уровня никогда не делали. Веб-проектики и ОРФО — уровень ниже. Большой поиск чем-то похож, но большого поиска, насколько я знаю, вы так и не сделали. > «Она мутировала» — это имелось в виду, что мутировали инструменты интриг Вот, облажались и начинаем изворачиваться. Теперь, значит, «имелось в виду совсем другое». Вы просто давно уже не в теме, что реально происходит в компании. Может быть, вы в какой-то степени имеете информацию через жену, но она, видимо, рассказывает вам только про интриги. > Я уже могу себе позволить в 2012 перестать в этом разбираться Ну вот и славно. Это хотя бы честное признание. > Обычно это такие хитроватые перцы в возрасте под 50 или даже за 50, с плохими перспективами на рынке труда, но зато ходящие с Каспером в качалку, в баню и на горнолыжные курорты. Судя по этой вашей фразе про интриги у вас вы тоже информация года эдак 2005го. «Обычно» вы оставили, чтобы в случае чего, можно было выкрутиться? Ну так выкручивайтесь теперь. Средний возраст разработчиков ЕКИ существенно ниже 50. Людей, про которых вы говорите, практически полностю отодвинули от принятия ключевых решений, это было в частности одной из причин переписывания Праги. > Попутного вам ветра, великие программисты. И ва не хворать.

  • Ответить
    Игорь Ашманов Сам себе компания

    «Средний возраст меньше 50» вставили, чтобы легче было выкручиваться? А не средний? Как там с дисперсией, и чем заняты в этом проекте те, кому за 50? Как вам ваши же немудрящие полемические приёмы? Ага, я так понял, что «людей» вы всё-таки узнали в моём портрете. В 2005 я ещё сам с ними бок о бок катался в Альпах. А вообще этих людей в должностях и при окладах-опционах (любителей тусовать с Каспером, пить пиво, париться в бане, рассекать по склонам и ходить с ним в качалку) я видел в деле ещё в 2007-2008. Никуда они не делись. И при нём всегда будут такие. Они нужны ему. Королю нужна свита, которая с утра до вечера убеждает его, что он таки великий. А ночью, когда свирепствует кариес, он спит, так что не успевает расстроиться. Вы — не такой? Молодой, энергичный, профессиональный? Вы не ходите лебезить, не пьёте пиво с начальством? Ну рад за вас. Хорошо, чтобы вы и в дальнейшем не дрогнули и вам не пришло в голову делать карьеру так, как было принято в ЛК в 2000-х годах. Насчёт «проекта такого уровня» — тут у нас есть уже один изготовитель всеобщего бурбулятора, уж вы-то не уподобляйтесь. Антивирусу лучше бы для начала выигрывать тесты, а не иметь внутри великую общую шину. Проекты «такого уровня» — это Юникс и всё такое, а у вас — очевидные скушные штуки, эпигонство и нуднятина, которые приходится ещё и переписывать. Я ведь читал единственное существовавшее описание Праги в лохматые годы: часть по-русски, часть по-английски, куски кода на Цэ, потом на полфразе обрывается. Читал и проект этой самой ЕКА. Это не проект «такого уровня», увы. В общем, вы внутри ситуации, она кажется вам уникальной. Но она — не уникальна. Как там, кстати защищённая ОС поживает? Годков ей сколько? Выпустите раньше, чем Компрено или позже?

  • Ответить
    Альтер Эго

    Большой поиск чем-то похож, но большого поиска, насколько я знаю, вы так и не сделали. большой поиск вообще-то, Игорь с командой, сделал в 2000 когда эта кашпировская «прага» была еще на бумаге. А пальцы гнуть не надо, кодер…

  • Ответить
    Альтер Эго

    Опять очередное писькоизмерение пошло. Вы бы хоть по теме чего ляпнули, уважаемые. Надо-елло. Давайте лучше обсудим технологию Абби. Я могу ошибаться, но когда я разговаривал с разработчиками этого «чуда» команда еще не была в лапах Абби. На тот момент у них была тестовая версия под юникс и вовсе не переводчика, а просто какой то шняги, которая давала осмысленные типа ответы на простые вопросы, потом возникла версия под винду и даже предлагалась к скачке. Судя по всему, именно на этом этапе ее и схавали Абби. И было это года 3 назад по-моему. Они скармливали программе тексты огромными объемами по тематическому классификатору и строили нечто подобное графу запросов, находя расстояния между ребрами путем банального вычисления кол-ва применимостей одних терминов к другим в нужной тематической коллекции. Все остальное, как я говорил выше. Полагаю, они и сегодня так делают и не используют уже готовый продукт из недр ПС, хотя могли бы. Так вот я скромно утверждаю, что если вдруг так и есть сейчас, пусть даже в каком-то усовершенствованном виде, то это никак не может конкурировать с продуктом на базе графов, строящихся в ПС. Давайте наконец забудем про Ашманова и его ностальгическими воспоминаниями о былом технологическом величии и поговорим о перспективах этой технологии. И кстати, об инвестициях. Хотелось бы и мне самому понять перспективность данной технологии с использованием спарсенных данных и построении запросного графа для всей коллеции запросов. Кстати, я честно скажу, что у меня строится плоский граф (мне этого хватает). Лично меня интересует качество перевода, если задействовать имеющиеся сегодня данные обоих ПС. К сожалению, я не могу предсказать этого, а делать на общественных началах прототип нет желания. Кто-нибудь мне поможет хотя бы теоретически с прогнозом? :) Ну давайте, яндексоиды, скажите что-нибудь умное наконец. А вы, Игорь, покурите пока в сторонке :)

  • Ответить
    Альтер Эго

    Где этот большой поиск, созданый в 2000? Может быть он называется гугл? или яндекс? Нет? Сделать «Большой поиск» в 2000, когда интернета в современном понимании не было можно было и без команды, этим многие тогда занимались. Получилось не у всех. У Ашманова — не получилось.

  • Ответить
    Альтер Эго

    Да хватит вам уже! Ну не интересно это никому! Посмотрите в название темы. Тема о том, что есть переводчик по смыслу и под него пытаются получить бабло. Дураку ясно, что это очень привлекательная инвестиционная тема и на рынке действительно очень мало чего есть стоящего. Безусловно, проект Абби один из тех, кто достоин пристального внимания, но суммы-то не маленькие и просрать, пардон, свои денежки никто не хочет. И хочется и колется. Я высказал свое мнение о минусах проекта Абби, а дискуссия свелась к обсуждению личности.

  • Ответить
    Альтер Эго

    > Никуда они не делись Читайте внимательнее. Они никуда не делись, их отодвинули от принятия ключевых решений. Кататься на лыжах, ходить в боулинг, и никто не запрещал. > Хорошо, чтобы вы и в дальнейшем не дрогнули и вам не пришло в голову делать карьеру так, как было принято в ЛК в 2000-х годах. C моей карьерой все в порядке, не волнуйтесь, не надо свои комплексы тут при всех показывать. > Я ведь читал единственное существовавшее описание Праги в лохматые годы: часть по-русски, часть по-английски, куски кода на Цэ, потом на полфразе обрывается. Читал и проект этой самой ЕКА Я очень рад что вы умеете читать. И что даже смоги почитать проект чего-то там. Я эти билиотеки использовал и знаю, что продающийся и приносящий деньги продукт построен на базе праги (старые версии) и еки (новые). > у вас — очевидные скушные штуки, эпигонство и нуднятина, которые приходится ещё и переписывать Ну вот опять, не знаем о чем пишем, но везде лезем. Конечно, у нас все скушно и нудно, мы не делаем сайты с инфами и анализаторы чужиз поисковиков и не гордимся софтом, который десяток лет назад продали микрософту. Всего лишь скромный антивирус, хорошо продающийся в мире и приносящий прибыль без всяких инвесторских денег богатой супруги. Ваши бизнес-советы о тм, что лучше бы делать антивирусу, можете оставить при себе — ценности они представляют весьма малую.

  • Ответить
    Альтер Эго

    а вшивые о бане опять… Кстати, о дырках в запросном графе (которые на низкочастотке будут портить весь перевод). Статистику можно и за 100 лет не насобирать, очевидно, что следует использовать синтез. Если решить эту проблему раньше яндекса и гугла, воспользовавшись выдачей самих же этих ПС, то можно и вырулить :)

  • Ответить
    Игорь Ашманов Сам себе компания

    Я могу ошибаться, но когда я разговаривал с разработчиками этого «чуда» команда еще не была в лапах Абби. На тот момент у них была тестовая версия под юникс и вовсе не переводчика, а просто какой то шняги, которая давала осмысленные типа ответы на простые вопросы, потом возникла версия под винду и даже предлагалась к скачке. Судя по всему, именно на этом этапе ее и схавали Абби. И было это года 3 назад по-моему. Вы продолжаете галлюцинировать. То, что делает Абби, насколько я могу судить, не имеет отношения к этим вашим выдумкам. ещё раз почитайте статью, с которой начался этот топик. У них классическая «тяжёлая лингвистика», модель Смысл-Текст, создание «языка смыслов» и т.п. Именно поэтому я не дал бы ни копейки на эту разработку. Вообще-то я снимаю дачу забор в забор с домом гендиректора Абби Сергеея Андреева (который как раз и разговаривал с Голубицким). И мы с ним и его женой и детьми летом жарим шашлыки у нас во дворе, прыгаем на батуте и вообще тусуемся. Иногда, внезапно, мы встречаемся и в Москве: оказываемся с ним вместе на разных отраслевых тусовках или в кабинете министра Щёголева. Если бы я вдруг, паче чаяния, внезапно захотел бы «вложить денег в Абби», я бы имел возможность поговорить об этом. Но как-то почему-то я такого вопроса так и не задал ему. Этот «язык смыслов» можно увидеть даже на картинках Голубицкого. А мы время от времени видим разработчиков оттуда и расспрашиваем, например на конференции в Яхроме только что. И делают они это с середины 90-х годов, а не три года. В проекте работают сотни лингвистов, которые занимаются этими фреймами ситуаций и прочим. Нет там никаких «многомерных графов запросов» и всего, что вам причудилось в гениальном пророческом сне.

  • Ответить
    Игорь Ашманов Сам себе компания

    Читайте внимательнее. Они никуда не делись, их отодвинули от принятия ключевых решений. Кататься на лыжах, ходить в боулинг, и никто не запрещал. А пиво, пиво-то с Основателем, вашим Биллом Гейтсом и Ричардом Брэнсоном в одном лице пить — не запрещали? Нет, хорошо, что теперь там плотным кругом стоят другие люди. Будем надеяться, что они совсем более другие. Вот вы — другой? C моей карьерой все в порядке, не волнуйтесь, не надо свои комплексы тут при всех показывать. Ну какие же у меня могут быть комплексы относительно вашей карьеры? А что вы так нервничаете? Сразу «я в порядке, в порядке!!!». Я эти билиотеки использовал и знаю, что продающийся и приносящий деньги продукт построен на базе праги (старые версии) и еки (новые). Знаете, мне кажется, вы несколько, так сказать, только не поймите меня правильно, выдаёте желаемое за действительное. Или сами не в курсе. А я тут слегка в курсе. Дело в том, что к 2005 году АиП делала для ЛК одновременно 7 заказных проектов, что нам очень не нравилось, потому что нас начало притягивать к большой ЛК. Это была одна из причин, почему мы решили продать Спамтест и отойти, чтоб нас не расплющило гравитацией. Так вот, один из этих проектов был, как вам ни покажется это удивительным, антивирус! Мы в 2004-2005 сделали по заказу ЛК антивирус под HPUX (это юникс такой, если вы не слышали), для ЦБ РФ. В ЛК в этих юниксах тогда мало кто разбирался. Так вот никакой «Прагой в продукте» тогда и не пахло. Возможно, что-то в этом говнокоде в конце концов выделили в какие-то библиотеки, ввода/вывода, скорее всего, и куда-то вкрячили, чтоб не было обидно, что совсем ничего не вышло. Как система, «платформа», целиком Прага никуда не пошла, насколько мне известно. А потом «её переписали с нуля», как вы сами пишете. Видно, когда Гребенников оттеснил старичков. И то, что в 2007-2009 годах ЕКА из Отдела Инноваций Каспера тоже навязывали людям в Техдепе, а они отбивались, потому что им нужно было, чтоб реальный продукт у пользователей работал, а не был «правильным» — это же реальная история ЛК. Потом, наверно, опять же частные библиотеки выделили и куда-то вкрячили, чтоб отрапортовать — ну так это понятно. Насчёт советов по бизнесу, которые вам не нужны. Конечно, они для вас бессмысленны, вы ж бизнесом-то и не занимаетесь, вы разработчик. Да и я в мировом продвижении антивирусов тоже не очень разбираюсь. Однако. Я слышал от одного человека, который лучше всех в нашей стране разбирается в бизнесе антивирусов и собственно открыл, построил, превратил в одного из лидеров и сделал прибыльной компанию ЛК, в которой вы работаете и имеете возможность получать большую зарплату и даже, наверно, опционы (LTI), что для бизнеса антивирусов очень важны тесты. Именно они — основа для принятия решений о покупке айтишниками малых, средних и крупных корпораций. А наличие единой платформы типа ЕКА может помогать немного экономить на разработке при освоении новых платформ, но к бизнесу большого отношения не имеет. И вот выигрыш тестов как раз зависит от правильной организации разработки. Так что там с тестами у KAV, разработчик? И последний вопрос, который вы стыдливо обошли молчанием, но который, по-моему, имеет прямое отношение к теме данной дискуссии, написанию наиболее великих общих платформ для обработки всего: что там с новейшей защищённой ОС, которая в ЛК разрабатывалась долгие годы? Вот это же без балды интересно.

  • Ответить

    Давайте наконец забудем про Ашманова и его ностальгическими воспоминаниями о былом технологическом величии и поговорим о перспективах этой технологии. Ну вы бы какую-нибудь ссылку дали на свою мега-технологию. А то вы хотите разговаривать с посвященными («граф запросов» это вообще что за граф такой?), но не похоже, что здесь есть хоть один.

  • Ответить
    Альтер Эго

    > Ну какие же у меня могут быть комплексы относительно вашей карьеры? > А что вы так нервничаете? Сразу «я в порядке, в порядке!!!». Да нет же, это вы нервничаете, вон сколько букв понаписани. Я вас наоборот успокаиваю, чтбы вы не переживали. > Знаете, мне кажется, вы несколько, так сказать, только не поймите меня правильно, выдаёте желаемое за действительное. Или сами не в курсе. Знаете, по-моему не в курсе именно вы. Вы с ЛК давно не работете и питаетесь слухами. В отличие от вас, я знаю, как дело обстоит на самом деле, т.к. у меня более точные источники информации (в частности, личный опыт работы с кодом и общение с людьми) > Мы в 2004-2005 сделали по заказу ЛК антивирус под HPUX (это юникс такой, если вы не слышали), для ЦБ РФ. В ЛК в этих юниксах тогда мало кто разбирался. > Так вот никакой «Прагой в продукте» тогда и не пахло. Ну вот опять начинаем изворачиваться, приводить примеры каких-то никому не известных антивирусов для мертвенького HPUX, который кто-то делал делали для ЛК по заказу. Очнитесь, ЛК сама, без вашей помощи, делает антвирус и лицензирует его — джуниперу, например. У которого на железках самый настоящий юникс. И там отлично работает портированная прага. Какие реальные истории и что вы там слышали от «человека, благодаря которому я могу получать большую зарплату» мне неинтересно. Вы просто давно уже не в теме относительно ситуации в компании и питаетесь исключительно долетающими до вас слухами. Это выглядит жалко.

  • Ответить
    Альтер Эго

    > что там с новейшей защищённой ОС, которая в ЛК разрабатывалась долгие годы? Понятия не имею, никогда не слышал о ней. > важны тесты. > Именно они — основа для принятия решений о покупке айтишниками малых, средних и крупных корпораций. Я уже говорил, бизнес-советы, да еще и полученые не от вас, а от «человека, который лучше всех в нашей стране разбирается в бизнесе антивирусов», перепетые вами на свой лад, неинтересны. Если этот «человек, который лучше всех в нашей стране разбирается в бизнесе антивирусов» сюда придет и сам озвучит свои советы, это будет интересно. Но я думаю, ей есть чем заняться, чем сидеть на роеме :) > Так что там с тестами у KAV, разработчик? Это вы к какому разработчику сейчас обращаетесь, просто интересно?

  • Ответить
    Глеб Суворов https://t.me/itsocial

    tyanitolkay, что гугль что яндекс нормальной статистики по запросам НЕ отдают. Ну так для начала. Так что спарсить запросы и выдачу это дело не самое хитрое, этим много кто занимается. А как объехать тот факт что процентов 50 запросов к гуглю уникальные в пределах месяца, и он их просто НЕ показывает в гкт ? и подсказки с инстант серчем похоже прикрутили, что бы с этим бороться. и например в русском и европейских языках после топовых 4-6 млн запросов лезет всякий шлак? и в америке после 60млн где-то. и в тч года довольно значительная часть запросов пропадает из базы, появляются новые (я эти базы уже года 4 разглядываю раз в неск месяцев) у яндеса такая же фигня — те запросы, что они показывают в вордстате уже предварительно «округлены» и сгруппированы. Что касается анализа запросов на основании поисковой выдачи: ну да, там можно извращаться и «открывать» взаимосвязи между запросами, некоторые сеошники это уже года 3 как делают, строят такие графы и как сервис продают (сам продавал). Но сделать на базе этого нормальный переводчик… :))))

  • Ответить
    Альтер Эго

    Это вы к какому разработчику сейчас обращаетесь, просто интересно? Как к какому? К анонимному же. Вот который тут анонимно знатока технологий ЛК строит из себя. Что, не по адресу? А тогда к какому мне анониму обращаться? Если этот «человек, который лучше всех в нашей стране разбирается в бизнесе антивирусов» сюда придет и сам озвучит свои советы, это будет интересно. Как я уже говорил, кошка бросила котят. Вы уж теперь сами, котята. Занимайтесь своей ЕКА, на здоровье. Я ж вам не советы даю по бизнесу (вы ж не бизнесмен, а программист, который «использует библиотеки ЕКА»), а спрашиваю, аккуратно так, не обидно: как там дело обстоит с тестами у вашего антивируса? Ну что, трудно ответить? Я даже не спрашиваю вас, как там дела с продажами и их производной, ростом. Это не к вам, я понимаю. Да и не по теме топика. Но вот то, что вы, разработчик, якобы не слышали про Каспер-ОС и не отвечаете про тесты, выглядит не очень убедительно.

  • Ответить
    Игорь Ашманов Сам себе компания

    … Знаете, по-моему не в курсе именно вы. … Ашманов как обычно пишет свое мнение о том, в чем он давно не разбирается. … Вы с ЛК давно не работаете и питаетесь слухами. … Ну вот опять, не знаем о чем пишем, но везде лезем. … Вы просто давно уже не в теме, что реально происходит в компании. … Вы просто давно уже не в теме относительно ситуации в компании … и питаетесь исключительно долетающими до вас слухами. В принципе, ещё 20 000 вёдер такой воды и золотой ключик у вас в кармане, а халва во рту. А всё-таки, сколько вам лет? А то вы и на этот вопрос не ответили. Это выглядит жалко. Да, но я же мазохист. Тем более, что это разговоры неважные, боковые, связанные с вашим личным тщеславием и комплексами по поводу карьеры. Мне-то с вашей разработкой и бизнесом всё и так более-менее ясно, и ЛК здесь всплыла в разговоре исключительно как пример разработки великой общей платформы, нужной, чтобы тешить самолюбие одного из основателей. Интересно обсуждать, как оно на самом деле, в трезвом свете чистого разума. Интересен именно человеческий, социальный механизм возникновения таких проектов: — основатель, отставший от развития технологий, но хотящий продолжать быть вундеркиндом, которому нужен новый большой проект, доказывающий его гениальность, — люди, имеющие на него влияние, с плохими перспективами на рынке труда, без свежих дебютных идей, — пресная идея чего-то максимально большого, общего, чтоб основателя торкнуло и получилась стабильная пенсия на 10-15 лет как минимум, — лесть, пиво, баня, неформальное общение, подхалимы, внутренний пиар, борьба за доступ к телу. Вот эта гремучая смесь и является зачастую причиной «больших проектов». И Прага в ЛК выросла именно по этой схеме. А причиной всему — безблагодатность тщеславие.

  • Ответить

    «То, что делает Абби, насколько я могу судить, не имеет отношения к этим вашим выдумкам.» Ну значит эта команда работает на других, значит я ошибся. «У них классическая «тяжёлая лингвистика», модель Смысл-Текст, создание «языка смыслов» и т.п.» тем хуже для них. А вообще, покурите, тут вот грамотный человек пришел, не вам чета. Можно я с ним поговорю, а то ваши близкие родственные связи вместе с огурцами и банями уже достали. «tyanitolkay, что гугль что яндекс нормальной статистики по запросам НЕ отдают. Ну так для начала.» Это я и без вас знаю, но сие не мешает вытаскивать нужное, даже несмотря на ваши ограничения в показах у вордстата коммерческих запросов а в директе некоммерческих соответственно. «Так что спарсить запросы и выдачу это дело не самое хитрое, этим много кто занимается.» Кроме меня их к нормальному графу никто не приводит на рынке, а парсят многие да.. «А как объехать тот факт что процентов 50 запросов к гуглю уникальные в пределах месяца, и он их просто НЕ показывает в гкт ?» Тут выход один, добывать нужные и недостающие связки самому из выдачи. Пока не знаю как. «у яндеса такая же фигня — те запросы, что они показывают в вордстате уже предварительно «округлены» и сгруппированы.» мне это не мешает, я все равно все перестраиваю. «открывать» взаимосвязи между запросами, некоторые сеошники это уже года 3 как делают, строят такие графы и как сервис продают (сам продавал). Но сделать на базе этого нормальный переводчик… :)))) » Я не знаю, что там другие ищут и как, особенно если не знают, чего именно хотят найти (возможно, что именно то, что я уже давно нашел). Я говорю о другой этапной задаче- о поиске тех НЧ запросов, которые свяжут семантические кластеры между собой прежде всего для пограничных пределов. «Ну вы бы какую-нибудь ссылку дали на свою мега-технологию. А то вы хотите разговаривать с посвященными («граф запросов» это вообще что за граф такой?), но не похоже, что здесь есть хоть один.» Сервис давно в паблике и многие его уже видели, а если вам прямая ссылка нужна, то попросите ее у Ашманова, пусть он пороется в своем помойном ведре, или куда он там все складывает не знаю :)

  • Ответить
    Альтер Эго

    Предыдущий альтерэга — видимо, спрятавщийся ашманов. Ибо довольно сложно случайно выбрать «писать анонимно». > от который тут анонимно знатока технологий ЛК строит из себя Знатока всего на свете тут из себя строит только один человек — вы. >вы ж не бизнесмен, а программист, который «использует библиотеки ЕКА» > Что, не по адресу? Меня смутило слово «разработчик» и вопросы про тесты KAV. И то, и другое — не по адресу, да. Ряд ваших выводов обо мне неверен. > Ну что, трудно ответить? Мы вообще-то говорим про то, что вы не знаете, как реально используетсся Прага и ЕКА. Я понимаю, вам хочтся съехать с этой темы, где вас ткнули носом в вашу полнейшую неосведомленность. > Занимайтесь своей ЕКА, на здоровье. И вам не хворать

  • Ответить
    Глеб Суворов https://t.me/itsocial

    Ahmed, ну мне-то покажите ссылку, я-то не ашманов. интересно же, что это за сервис такой, а я про него не слыхал (не узнаю вас в гриме). да достаются эти связи по НЧ из выдачи, без особого труда. толку-то с того.

  • Ответить
    Альтер Эго

    > Интересно обсуждать, как оно на самом деле, в трезвом свете чистого разума. > Интересен именно человеческий, социальный механизм возникновения таких проектов: Возможно, вам интересно обсуждать сферического коня в вакууме — у каждого свои интересы. Прага или ЕКА такими проектами не являются.

  • Ответить

    «да достаются эти связи по НЧ из выдачи, без особого труда. толку-то с того.» Видимо, мы говорим о разном. Граф от одного запроса строится легко со всеми коррелирующими, все расстояния определяются между ребрами. Проблема из всех этих пазлов составить целую картинку всей семантики рунета таким образом, чтобы расстояния между соединяющими кластеры пограничными ребрами были минимизированы (классическая мат. задача нахождения минимальных расстояний). Т.е. повернуть геометрически кластер так, чтобы он подогнался со смежнотематическими с минимальными расстояниями у ИМЕЮЩИХСЯ найденных при парсинге границ. После такой чисто комбинаторной процедуры подгонки, для узлов, где нет связей, а по всей логике они должны бы быть, ищутся (подставляются наиболее близкие семантически к каждому из узлов) недостающие фразы, чтобы скрепить эти точки. Т.е. это синтетический способ образования нужных НЧ, которых естественным путем можно ждать в статистике 100 лет. Как вариант, можно искать их в выдаче, забивая в ПС запрос из 2х узловых точек. Поисковик сам найдет докумены, связывающие по НЧ эти точки и в сниппете отобразит нужные фразы. И вот имея такуя целую структуру по всей коллекции запросов + 50% синтезированных, а то и больше, можно уже говорить о переводчике, точнее, об 12 его части если такую же байду делать для англоязычного запросного графа.

  • Ответить

    Вопрос к Ашманову — скажите, Игорь, а существуют у вас автоматические оценки качества переводчиков наподобии того, которые существуют для поисковиков? Если да, то как сейчас расположен рейтинг систем перевода в англорусском направлении? Спасибо!

  • Ответить

    Да, сделайте наконец еще одну полезную вещь, эта задача как раз соответствует вашему проф. уровню и поразвлекаетесь заодно с ЖЕСТКОЙ лингвистикой…вашей любимой. Спасибо заранее…выручайте, будьте так любезны. Большим ребятам (это я про ПС) опять же польза будет, надо же на чем то тестировать свои алгоритмы :)

  • Ответить
    Игорь Ашманов Сам себе компания

    Возможно, вам интересно обсуждать сферического коня в вакууме — у каждого свои интересы. Прага или ЕКА такими проектами не являются. Блажен, кто верует, тепло ему на свете. Я лично видел возникновение сферической Праги с самого начала, читал бумажки, разговаривал со всеми фигурантами, в том числе с «изобретателями» платформы, и с Каспером за пивом в боулинге или глинтвейном в горах. Это классический случай, настолько типовой, что даже смешно. Обычно разработчик думает, что главное — это технология. Коммерсант понимает, что надо ещё продать. А ещё важнее — социальная обстановка вокруг технологии и продаж. Вот почему Доктор Веб не стал лидером, а стал продукт Касперского? Собственно антивирусная технология Доктор Веба очень долго была не хуже, да и сейчас не всегда можно отличить. В чём причина? В социальной обстановке в этих двух компаниях. Кто решал, какие продукты выпускать, куда совершать экспансию, как организовывать разработку и продажи. В отношениях собственности, в основной психологии компании. В Доктор Вебе 20 лет всё решали и решают программисты. Результат нам известен. Возникновение самых великих и наиболее общих платформ — это только малая толика той социальной турбулентности, что гуляет в компаниях. В частности, великие платформы можно позволить себе, только когда ты уже достаточно известный и богатый. Впрочем, я видел компанию, где такую платформу всеми силами строили, НЕ будучи богатыми и лидерами на рынке. В результате они три года не могли выпустить новой версии, разорились и были за долги куплены конкурентами. Пересели из кресла владельцев в кресла наёмных кодеров. А причина в том, что бизнес-вопросы решали там программисты, которых было легко увлечь. Про это, собственно, и был выше задан вопрос — что бывает с такими проектами, могут ли они закрываться сами. Мне кажется, сами не очень могут, закрывают конкуренты, часто вместе с компанией, поражённой этой опухолью.

  • Ответить
    Игорь Ашманов Сам себе компания

    Вопрос к Ашманову — скажите, Игорь, а существуют у вас автоматические оценки качества переводчиков наподобии того, которые существуют для поисковиков? Пока нет. Как я писал выше, может быть, сделаем свой анализатор, но не сейчас. Тестов МП и сейчас существует в количестве. В частности на нашей конференции был круглый стол, где в том числе какое-то время разработчики МП из Яндекса и Абби обменивались о них впечатлениями и позициями «этот признаём», «этот не признаём». Мой личный рейтинг простой: 1. ПроМТ. 2. Гугл. 3. Яндекс, пока с большим отрывом снизу. Этап-3 — вне рейтинга, он перпендикулярен. Потому что пока не работает и в него нельзя засунуть много текстов — обязательно случится какая-то лажа, то есть тестировать его можно только на фразах, предлагаемых разработчиками, чтобы удивиться какому-то красивому частному случаю (который тебе предварительно подробно объяснили). Та же ситуация пока с переводчиком Абби. Он вне рейтингов, ибо существует пока в параллельной, медийной и научной реальности, реальности статей в КТ, презентаций, заготовленных примеров и показа из рук. В принципе, Абби — не то же самое, что лаборатория в ИППИ РАН, у них есть опыт выпуска успешных массовых продуктов в области ИИ. Так что они могут рано или поздно прийти из далёкого космоса, появиться и в нашей реальности, в околоземном пространстве.

  • Ответить
    Альтер Эго

    > Блажен, кто верует, тепло ему на свете. Замечательная фраза, хотел ее вам сказать, но вы сами уже это сделали. > Я лично видел возникновение сферической Праги с самого начала, читал бумажки, разговаривал со всеми фигурантами, в том числе с «изобретателями» платформы, и с Каспером за пивом в боулинге или глинтвейном в горах. Это классический случай, настолько типовой, что даже смешно. То, что вы видели, устарело лет на 5-7. Продукт тогда был гораздо менее сложный, необходимсть такой технологии была неочевидна, да и технологии еще не было. Сейчас, когда она есть, без нее продукт делать невозможно. Любой человек, хотя бы немного понимающий архитектуру оснонвнго продукта Касперского, это знает — подавляющая часть кода явно использует Прагу или еку. Вы же живете в мире собственных фантазий, застряв там с момента, когда что-то там видели и читали. Вы же «в 2012 году можете себе позволить перестать в этом разбираться». Вот и перестали, что очень хорошо видно. Но желание поумничать осталось. Да, компания была достаточно богатой, чтобы позволить себе делать такую библиотеку. Она ее сделала и успешно использует, и стала еще богаче. Связи мнежду этими двумя событиями может, кстати, и не быть. Но факт остается фактом — библиотека используется по прямому назначению в основном продукте компании, несколько лет. Очень забавно смотреть как вы вертитесь как уж на сковородке, перескакивая с темы на тему, иногда пытаясь тему поменять — в разговоре про Прагу вы пытались перевести тему на вопросы про тесты антврвуса, карьеру, зарплату, вашу жену, по милости которой я могу получать больую зарплату, пиво с Касперским, теперь вот, сравнение с доктор вебом. А все для того, чтобы среди этого потока слов, спрятать простую мысль — про Прагу и ЕКУ вы сморозили глупость, уже несколько раз, потому что не знаете реального положения вещей.

  • Ответить
    Игорь Ашманов Сам себе компания

    Про Прагу ясно уже, вы повторили много раз. Понятно, что я не разбираюсь ну совсем. Вообще шипеть «некомпетентноссссссть» — классическая мантра аутичных горлумов из среднего слоя разработки. Дорогой аноним, вы бы лучше ответили простой вопрос про тесты. Это ж нетрудно. Вы же в курсе, не может быть, чтоб вы не интересовались этим. Это же основной показатель технологичности продукта. Как уже говорилось выше, более общая и универсальная архитектура позволяет сэкономить денюшку на переносе на другие платформы, на выпуске новых версий, да и то это иногда сомнительно, потому что кто-то же саму архитектуру разрабатывает годами за дополнительные деньги. А вот тесты на %% обнаружения, на скорость обнаружения нового и т.п, на эвристики — это и есть технологичность. Которой ваша Прага вообще-то всегда мешала, сколько я мог наблюдать. Раньше, в эпоху «до Праги и ЕКА», когда Каспер сидел в Отделе инноваций и рулил дятлами, а Техдеп занимался продуктом, антивирус Касперского часто брал в тестах первые и верхние места. А сейчас? Что там с главным технологическим показателем вашего продукта? Это прикольно понять именно с точки зрения того, как распухшая всеобщая платформа влияет на нормальное дыхание продукта. P.S. Замечу, что я вообще-то желаю успеха ЛК. Это флагман нашей ИТ-индустрии, не Айбиэсы там всякие беспонтовые. Так что за собственно компанию можно со мной не бороться, боритесь за то, что я идиот, проявляющий полную неосведомлённосссссссть.

  • Ответить
    Альтер Эго

    > Понятно, что я не разбираюсь ну совсем Ну вот и славно, что вы это признали. > Как уже говорилось выше, более общая и универсальная архитектура позволяет сэкономить денюшку на переносе на другие платформы, на выпуске новых версий, Совершенно верно. Имено это на практике в случае с основным продуктом ЛК и просходит. Вы итоге продукт развивается, выходит на другие рынки и — сюрприз — денюшек становится больше. > А вот тесты на %% обнаружения, на скорость обнаружения нового и т.п, на эвристики — это и есть технологичность. Которой ваша Прага вообще-то всегда мешала, сколько я мог наблюдать Наблюдения ваши устарели лет на 5-7. Сейчас есть платформа для построения антивируса, она позволяет быстрее решать бизнес-задачи — например писать и интегрировать в продукты новые компоненты (облако, HIPS и т.д.) Без платформы это делать было бы значительно тяжелее. Вы опять зачем-то пытаетесь ее перевсти тему на тесты. Пытайтесь-пытайтесь. Поскольку в этом вопросе вы тоже разбираетесь поверхностно (хотя бы потому, что ни словом не упомянули про определяющее влияние качества работы вирлаба на результата тестов), эту тему обсуждать с вами мне просто неинтересно.

  • Ответить
    Игорь Ашманов Сам себе компания

    Наблюдения усссстарели! Разбираетессссть поверхноссстно! Да-да. Вообще-то, про то, что пока Каспер рулил дятлами, тесты были более-менее нормальные — я таки написал, просто вы от злости читаете невнимательно. Я думаю, что вас и в ЛК ещё не было, когда я уже таки знал из первых рук, как оно там работает и что там влияет на тесты, любезный мой разработчик. Обычно такие горе-защитники компании — это третья волна найма, они к начальному напряжению и к успеху не причастны, просто делают свою работу за высокие оклады, но больше всего бронзовеют и раздуваются. Вот вы когда пришли в ЛК? Вы итоге продукт развивается, выходит на другие рынки и — сюрприз — денюшек становится больше. Вы такой потешный. Вот уже и собственный взгляд на бизнес начали излагать. Да вы, я смотрю, бизднесмен! Ну давайте про бизнес и влияние на него великой платформы. Значит, правильно я понял: единая компонентная архитектура экономит кучу денег на разработке, это позволяет выйти на новые рынки (какие, кстати?) и заработать ещё больше денег? Да у вас отличный план, мистер Фикс! Захват новых рынков за счёт экономии на разработке — да это новое слово в бизнесе и маркетинге. А ничего, что рост компании с победой ЕКА и её адептов кардинально замедлился с 140% в 2007 до 14% в 2011, а доли продаж всего, кроме персонального антивируса под Винду, резко упали — в том числе корпоративной версии, и любимых вами иксов, и ОЕМ-версий? А расходы в 2011 выросли не на 14%, а на 25%, что явно показывает положительный эффект от ЕКА. Между тем, у вас, если вы не заметили, компания превратилась в компанию монопродукта, которой как раз уже ничего и не нужно универсального. Вы продаёте по сути одну виндовую коробку. Пока построенная Натальей система из десятков тысяч партнёрств её всё ещё втюхивает, но выход на сцену бесплатных антивирусов с другими бизнес-моделями начинает убивать целые регионы, как Китай, например, где падение продаж уже в разы. И вторая производная от продаж давно под осью абсцисс, да и первая скоро её поцелует, уже в этом году, скорее всего. Думаю, с 2013 начнётся абсолютное падение продаж. У вас уже началась резкая экономия в компании, не заметили ещё? Конечно, дело тут не в Праге или ЕКА. Просто и то (вбивание ресурсов в великую платформу, потому что основатель хочет великого), и другое (падение продаж и сужение продуктовой линейки, потому что основатель не любит продажи, корпоративный софт и юниксы) демонстрирует нехорошие социальные процессы в компании. Так что там с тестами и отличной работой вируслаба на фоне доминирования ЕКА и резкой экономии на выходе на новые рынки? И нет ли у вас ещё какой бизнес-теории?

  • Ответить
    Игорь Ашманов Сам себе компания

    Ещё вопрос. Если ЕКА якобы дала ускорение разработки и reusable code и прочие мечты разработчиков, то почему корпоративная версия у вас выходила 4 года и вышла как бы в релиз только в конце 2011? Это и есть ускорение разработки? Почему Техдеп за четыре года распух в 4 раза, до 800 человек? Это экономия? И ведь всё это по сути для разработки одного продукта, персональной виндовой коробки. У вас даже корпоративный клиент стал неотличим от неё. ОЕМ-контракты у вас в полном загоне, упомянутому вами контракту с Juniper уже 10 лет, я ещё его обсуждал с Натальей и Каспером на ЦеБИТе в 2004, когда они просили специфической разработки и надо было придумать схему авансирования. Когда-то основные ОЕМ-партнёры G-Data, F-Secure сейчас отказались от вашего движка. Всё в ОЕМ резко падает. В ЛК это озвучивается так, что принято стратегическое решение от ОЕМа-уходить, загнули цену до заградительной цены. Минимальный контракт с ЛК — 400К, а с Битдефендером — 40К. В итоге ОЕМ сейчас составляет в обороте ЛК 2-3%, а было 15-20%. А ведь движок ЛК все годы с девяностых брали именно из-за высокого уровня детекции, не из-за ЕКА.

  • Ответить

    Слушьте, а IBMовский игрец в Jeopardy это то же самое? Или это что-то узко заточенное на жеопардийный корпус и ни к чему более не пригодный? Интересно же, скрестить эту штуку с Siri, будет хотя бы с кем поговорить в дороге…

  • Ответить

    Если ЕКА такая крутая, то почему ЛК до сих пор не сделала 64-битные версии антивируса и антиспама для FreeBSD и линукса?

  • Ответить
    Альтер Эго

    Как Ашманов разбушевался «горе-защитники компании», «Вот вы когда пришли в ЛК?», «доли продаж упали», «преватилась в компанию мнопродукта» (можно подумать, она когда-то ей не была, хаха). Изо всех орудий. Ваши рассуждения о ситуации внутри компании, ваши громкие заявления, облаченные иногда в форму вопросов, неинтересны. Можете сколько угодно тут дальше надрываться. Меня интересует только ваше высказывание о праге и еке в первых сообщениях треда. Они, как мы уже выяснили с вашей помощью, действительности не соотвествуют. > Вот уже и собственный взгляд на бизнес начали излагать Потешно излагаете свой взгляд на бизнес вы (написав очень большим количеством букв, и забрызгав все вокруг). Я всего лишь констатирую факты. На базе праги (да, той самой праги, которая мешала, насколько _вы_ знаете), несколько лет подряд выпускались успешные продукты и их юниксовые версии. Вы вцепились в ЕКу и падение продаж, потому что про прагу ничего подобного сказать не можете, хотя выступления свои начали с упоминания как раз праги. Остается только сказать, что вы не только не в теме, но в очередной раз облажались. и развести руками.

  • Ответить
    Альтер Эго

    > Если ЕКА такая крутая, то почему ЛК до сих пор не сделала 64-битные версии антивируса и антиспама для FreeBSD и линукса? Если EKA такая крутая, почему ЛК до сих пор не сделала 64-битную версию антивируса и антиспама под AIX? Если микрософт такой крутой, почему он до сих пор не выпустил 64-битную версию Visual Studio?

  • Ответить
    Альтер Эго

    > Я думаю, что вас и в ЛК ещё не было, когда я уже таки знал из первых рук, как оно там работает Не » уже таки знал» а » еще таки знал». > Любезный мой разрботчик Сколько желчи, и все мимо кассы.

  • Ответить

    Слушьте, а IBMовский игрец в Jeopardy это то же самое? Или это что-то узко заточенное на жеопардийный корпус и ни к чему более не пригодный? Нет, Ватсон айбиэмовский — это не совсем оно. И там и там — тема «обработка естественного языка/natural language processing» — но у IBM упор на информационный поиск и ответы на вопросы, а у Abbyy — упор на перевод, еще и обернутый в некую универсальную онтологию всего на свете. ну а Ватсон он заточен узко — но скорее не на жепардийный корпус (этот корпус сам по себе обширный, чуть ли не универсальный) — а на конкретный игровой формат. Но, понятно, вообще разрабатывалось это все не только что бы в викторину поиграть.

  • Ответить

    Я бы сказал, что Ватсон заточен под задачу ответа на вопрос. Игровой формат потребовал дополнительной докрутки, но основные усилия были, чтобы повысить полноту и точность, с которой система отвечает на вопросы.

  • Ответить

    ЗЫ: под конкретные типы вопросов Jeopardy заточка, конечно же, была не маленькая, но по сути это QA, который под любой домен можно заточить. Согласен с тем, что там был упор на поиск. У меня даже сложилось впечатление, что Ватсон — это сильно продвинутая поисковая машина, которая генерирует множество гипотез с помощью поиска, а потом собирает множество сигналов, в том числе полученных за счет обработки текста (кто кого там харлал имеет значение) и отбрасывает маловероятные.

  • Ответить

    Я так понял что упор на перевод-то довольно относительный. Они компилируют естественный язык в своеобразный RTL и потом из этого RTL обратно собирают фразу на другом языке. Ничто же вроде не мешает это второе действие не делать, а просто дальше работать со «скомпилированным» деревом? Я понимаю что «отвечалка» есть у ватсона, но нету у компрено, у которого вместо отвечалки — декомпилятор в другой язык, меня интересует как раз именно «понималка».

  • Ответить

    to Egogo > Если ЕКА такая крутая, то почему ЛК до сих пор не сделала 64-битные версии антивируса и антиспама для FreeBSD и линукса? Если EKA такая крутая, почему ЛК до сих пор не сделала 64-битную версию антивируса и антиспама под AIX? Ваш ответ — типичная демагогия. Каков процент рынка серверов у AIX, и каков у amd64 FreeBSD и линукса?

  • Ответить
    Альтер Эго

    > Ваш ответ — типичная демагогия. Каков процент рынка серверов у AIX, и каков у amd64 FreeBSD и линукса? А какой процент рынка у 64-битных windows? 64-битной студии Микософт действительно не выпустил.

  • Ответить
    Игорь Ашманов Сам себе компания

    Ваши рассуждения о ситуации внутри компании, ваши громкие заявления, облаченные иногда в форму вопросов, неинтересны. Да понятно, неинтересны. Неинтересно же, когда не можется прямо на прямо поставленные вопросы ответить. Вы ведь уже, наверно, в пятый раз игнорируете неудобный вопрос про тесты. Ну и про возраст и стаж работы в ЛК — тоже. Горе-защитник. Меня интересует только ваше высказывание о праге и еке в первых сообщениях треда. Они, как мы уже выяснили с вашей помощью, действительности не соотвествуют. Нет, не выяснили. Мы прочли десяток дублей вашего высказывания «это не так, зуб даю». И всё. Ещё раз: 1. Прака и ЕКА имели свой целью достижения авторами этих богатых идей лучшего положения в компании и большего влияния на основателя. 2. С точки зрения того, что заявлялось и что получилось, гора родила мышь. Иначе и быть не могло. Те, кто обещал это сделать, известны, это люди не семи пядей во лбу и не супер-профессионалы. 3. Конечно, для сохранения лица как инициаторов (подхалимов), так и основателя, который поставил свое имя на этом проекте, какие-то кусочки Великой Платформы должны были быть встроены в продукты. И будут и дальше навязываться разработчикам. 4. Прямого влияние на бизнес подобная технология не оказывает, да и не может оказывать. Экономии денег там вообще может не возникать, экономия времени незначительна. Нормальная ситуация, когда в компании разработчики хотят иметь воспроизводимый код, обеспечивающий разумный уровень абстракции и виртуализации, здесь была возведена в ранг идеологии, визионерства и всяческого величия. 5. Таким образом, «с вашей помощью мы выяснили, что» (с) это классический случай общей шины, то есть социальных процессов и интриг за влияние, а не адекватной разработки необходимой платформы.

  • Ответить
    Альтер Эго

    > Нет, не выяснили. Это печально. Я не ставил целью убедить в чем-то вас, и то, что вас переубедить не получится, вполне вожидаемо. > Мы прочли десяток дублей вашего высказывания «это не так, зуб даю». Мы прочли множество различных высказываний про кошку, бросившую котят и про то какой Ашманов умный и как много он знал, когда его жена работала в ЛК. По существу ваши аргументы от «Парага — это никому не нужна общая шина, я это 5 лет назад видел, зуб даю!» ничем не отличаются. Видите ли, код, использующий прагу вдоль и поперек, а также исходники самой праги, лежат в торрентах и любой желающий может посомтреть на него, чтобы понять насколько широко Прага использовалась в недавних версиях продукта. Я думаю, если нас читает хоть кто-то из желающих, он скачает и посмотрит. Ему станет все понятно. Советую, кстати, сделать то же самое, доступа к реопзитарю у вас, наверное, нету. Будете знать, хотя бы, на что был похож код до ЕКи. И поймете, что не стоит, не разобравшись, писать глупости вроде «какие-то кусочки Великой Платформы должны были быть встроены в продукты. И будут и дальше навязываться разработчикам.» и прочих, которые вы тут с избытком написали выше по треду. > Да понятно, неинтересны. Неинтересно же, когда не можется прямо на прямо поставленные вопросы ответить. Вы ведь уже, наверно, в пятый раз игнорируете неудобный вопрос про тесты. Я вроде довольно точно уже обьяснил, почему мне неинтересно с вами обсуждать эти вопросы. Перечитайте еще раз ответы, возможно, поймете. Вроде бы уже повторял по-разому несколько раз, должно дойти.

  • Ответить
    Альтер Эго

    Пиар. Как раз к выборам. Теперь мы знаем, что у нас тоже есть Высокие Технологии. Коммерческие перспективы? В общем-то, если бы продукт хотя бы наполовину оправдывал ожидания, в Abbyy уже стояла бы очередь из заинтересованных лиц. От метро и до офиса. Из посыпающих голову пеплом и реагентами представителей Google, Microsoft, Oracle, IBM, Samsung… А вообще Ашманов прав. Компания, пятнадцать лет вкладывающая собственное бабло в разработку продукта и в результате показывающая прототип Голубицкому (?) выглядит странно и пафосно. Кто, какой матёрый человечище догадался так пиарить заведомо корпоративный продукт? Продают не так. А так не продают. Вернее, продавать-то можно как угодно и что угодно. Покупать – нет. Если ты не Одно Богатое Государство, у которого есть золото и лес.

  • Ответить
    Игорь Ашманов Сам себе компания

    Вы ведь уже, наверно, в пятый раз игнорируете неудобный вопрос про тесты. Я вроде довольно точно уже обьяснил, почему мне неинтересно с вами обсуждать эти вопросы. Перечитайте еще раз ответы, возможно, поймете Да у меня вообще-то нет проблемы понимания, почему вы не отвечаете на вопрос про тесты. Это — понятно. Неспроста же вы вертитесь и так, и сяк, написали тыщи буков, только на сам вопрос не отвечаете, уже пятый раз. Если бы позиции в тестах были хорошие и выгодно смотрящиеся, вы бы немедленно дали ссылочки, с торжеством и гордостью. Так что «мне неинтересно», повторенное пять раз при том, что вы никак не можете выйти из неинтересной дискуссии, всё пишете и пишете — довольно жалкая отмазка, шитая белыми нитками

  • Ответить
    Альтер Эго

    > вы никак не можете выйти из неинтересной дискуссии, всё пишете и пишете — довольно жалкая отмазка, шитая белыми нитками Вы слишком высокого о себе мнения. У нас с вами нету никакой дискуссии. Просто вы пытаетесь съехать с темы про Прагу, кидаясь из стороны в сторону, а я возвращаю обсуждение к исходной теме. Вы, бьете себя пяткой в грудь (правда, все менее активно, т.к. против настоящего кода с использованием праги в каждом вотоом файле возразить вообще нечего) и пытаетесь поменять тему разговора на придуманную вами же. Дешевый прием, тоньше надо.

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну что, уклонились от вопроса про тесты в шестой раз? Вот это мастерство. Но опять понаписали байтов. А ведь вам крайне неинтересна эта дискуссия! Про наличие библиотек Праги в продуктах действительно возражать нечего. Я и говорю, что её внедряли последние пять-семь лет чуть не под дулом пистолета. Я уже выразил свою точку зрения предельно ясно: Прага была идеологическим и социальным явлением. Попыткой приобрести больше власти и «джоб секьюрити» (для слабых сотрудников) за счёт влияния на основателя. А для основателя — попыткой поддержания имиджа технологического визионера и лидера. Чтоб не признавать того, что гора родила мышь, детали этой мыши пихали везде и навязывали. Путём бегания с жалобами к основателю, что вот сволочи и дураки не понимают и не хотя внедрять великую технологию. Я помню несколько таких острых скандалов внутри ЛК, когда этот говнокод отказывались брать в реальные продукты. Где-то ещё в 2004-2005 появились какие-то отдельные библиотеки россыпью, которые требовали включать в продукты. Когда Капспер отодвинул Наталью от оперативного управления в 2007, эта клика под названием «Отдел инновационных технологий» таки навязала свою волю производству, а затем втюхнула ЕКА всем, чтобы закрыть вопрос, что ж там безрезультатно разрабатывали чуть не 10 лет. Теперь указывать на этот факт, как на свидетельство полезности технологии — глупо. Мы обсуждаем одно и то же явление, только вы в нём видите создание и использование полезной технологии, а я — результат интриги и бесполезное сжигание ресурсов. Ещё раз: reusable code, достаточный уровень абстракции платформы, виртуальные машины — полезная вещь, без балды, но мы имеем здесь дело с социальным феноменом, а не технологическим. Только потому, что это феномен имеет значительную общность и встречается в разных компаниях, и мне задали самый общий вопрос про это, я его здесь и обсуждаю. А так вообще-то ваш конкретный мирок крысиных гонок за благоволение вождя не очень интересен. Как и вечно пьяный вождь, давно повесивший ключ от мастерской на гвоздик, но каждый год делающий апокалиптические прогнозы о близком крахе всего и требующий паспортизации Интернета. Ладно, не буду больше вас терзать, а то вы ведь не сможете остановиться, гордость и корпоративный долг не позволят промолчать. ЛК — хорошая компания, в целом вы делаете нужное дело. Нормальных, умных и трудолюбивых людей там 95%, как везде. Желаю вам побыстрее понять, что делать с бизнес-моделью бесплатных антивирусов и с качеством детекции у конкурентов.

  • Ответить

    По оценке AV-Comparatives Касперский — Product of the Year 2011, причем победа убедительная, судя по табличке — только у Каспера строка оценок полностью зеленая. По тесту Гартнера Касперский впервые вошел в сектор лидеров. Дважды поздравляю ЛК! Но что касается ЕКА, то Ашманов скорее всего прав. По теме треда — у меня позиция похожа на ашмановскую, я пока скептически отношусь к такому подходу. Подождем нормальных тестов и профессиональных оценщиков. Если действительно получится, будет нереально круто. Ну и в целом Абби за свои труды и упорство достойно уважения, даже если ничего не выйдет.

  • Ответить
    Альтер Эго

    > А ведь вам крайне неинтересна эта дискуссия! Я же сказал, у нас с вами нет никакой дискуссии, не надо быть о себе такого высокого мнения. Вы что, утратили навык читать буквы? То, что у нас с вами происходит — скорее полемика, а никак не дискуссия, улавливаете? > Про наличие библиотек Праги в продуктах действительно возражать нечего Я говорил не просто про наличие, а про то, что весь код продукта эту Прагу активно использует. И это легко подтверждается кодом и на это действительно нечего возразить. Вашими «социальными феноменами» это не объясняется. > [пространные словеса «а я-то в советские времена ооо!» поскипаны] Мне неинтересно ваше мнение об интригах внтури компании, происходивших при царе Горохе — к реальному положению вещей с Прагой оно не имеет никакого отношения. От эмоциональных оценок в технологических вопросах нужно воздерживаться. Можно сколько угодно повторять на разный лад, что Прагу навязали под дулом пистолета, что гора родила мышь, потому что вам обидно, что ничего не понимающие (с вашей точки зрения) люди отодвинули вашу жену от управления, но факт того, что Прага как технологическая основа успешно использовалась для выпуска продуктов нескоько лет (что легко потдверждается кодом), просто нельзя. Между прочим, в 2007 и 2008 годах на базе Праги были выпущены продукты, исходники одного из которых любой желающий может посомтреть. ЕКу начали разрабатывать на замену Праги в конце 2008. То есть получается, что до того, как «клика навязала свою волю руководству», продукт на базе Праги уже был выпущен. Вы при помощи словесных выкрутасов, пытаетесь эти факты замести под ковер и выставить как несущественные. Вот уже начали себе готовить пространство для маневра, разделяя «технологические» и «социальные» феномены. Старая песня «имелось в виду совсем другое», спетая на новый лад. «Теперь указывать на этот факт, как на свидетельство полезности технологии — глупо.». Попытка приписать мне то, чего я не говорил, так, как удобно вам. Не получится. Я говорил, что на базе Праги были сделаны успешные продукты, где эта технология не прицепленная под давлением сбоку, а системообразующая. Глупо игнорировать этот простой и легко проверяемый факт. Хотя, наверное, дело уже не в глупости, а в вашей гордыне. > Ладно, не буду больше вас терзать Вы ошибаетесь, я получаю от этой беседы огромное удовольствие. Может быть, это вас что-то терзает? Не стесняйтесь, скажите. > ЛК — хорошая компания, в целом вы делаете нужное дело И вам не хворать

  • Ответить

    Я бы сказал, что Ватсон заточен под задачу ответа на вопрос. Игровой формат потребовал дополнительной докрутки, но основные усилия были, чтобы повысить полноту и точность, с которой система отвечает на вопросы. Ну система ответов на вопросы там тоже достаточно усеченная: без функции поддержания диалога(и соответственно без уточняющих вопросов), вопросы простые фактоидные, ответы так же простые — одно- и двух — словные. У меня даже сложилось впечатление, что Ватсон — это сильно продвинутая поисковая машина, которая генерирует множество гипотез с помощью поиска, а потом собирает множество сигналов, в том числе полученных за счет обработки текста (кто кого там харлал имеет значение) и отбрасывает маловероятные. Судя по статьям разработчиков — что то типа того: синтаксический анализ, поиск по образцам, потом формирование гипотез по разным эвристическим правилам, их обеднение и выбор наилучшей. В общем — классический подход только на современном техническом уровне.

  • Ответить

    А если представить что Эбби таки разработало то, что они говорят что разработали, то с использованием их «понималки» можно будет с Ватсоном поговорить? То есть хотя бы задать ему общий вопрос, получить ответ, и итеративно привести его к нужному результату уточняя детали?

  • Ответить
    Игорь Ашманов Сам себе компания

    А если представить что Эбби таки разработало то, что они говорят что разработали, то с использованием их «понималки» можно будет с Ватсоном поговорить? Если представить, что таки разработало, то можно будет хоть с Богом поговорить. Но представить трудно. Речь ведь идёт о прагматике, модели мира, понимании того, как устроен мир и связаны между собой его части в уме человека. Это же самая сложная умственная работа на свете: раскладывать окружающий мир по полочкам. Ничего сложнее классификации смыслов не бывает. Кто делал хоть раз в жизни каталог чего угодно — знает об этом. Сейчас модно это называть «онтологиями», «прагматикой» и т.п. А раньше это называлось тезаурусами. Практически в каждом министерстве в СССР составлялся огромный отраслевой тезаурус, то есть словарь понятий с родо-видовыми, часто-общими и прочими связями, гипонимами, гиперонимами, когипонимами и т.п. В ВИНИТИ научный тезаурус был на сотни тысяч терминов, с 15-ю уровнями дерева. То же самое делалось и в США. И где оно всё? «Понималка» Абби от этого принципиально отличается тем, как я могу судить по скриншотам, что у них это: а) словарь не из слов конкретного языка, а из выдуманных ими латинских обозначений для «смыслов», как будто от этой латинизации что-то изменится (это вообще болезнь отечественной лингвистики — говорить обязательно каузировать вместо причинять или вызывать), и б) у них есть не входящие в иерархии (или входящие) специальные «фреймы» ситуаций с актантами, где, вероятно, ядром ситуации является глагол (по истинным заветам истинного Мельчука). Но если на минутку отложить эту разницу (тем более, что она нипаддеццки добавляет сложностей и трудоёмкости в проекте — ведь сначала надо учить лингвистов выдуманному языку) и вернуться к тезаурусам, то здесь нас (и Абби) должен был бы навести на некоторые мысли тот факт, что полноценных тезаурусов в мире всего два: Роже и Робер. И оба разрабатываются больше полутораста лет. То есть только два народа в мире асилели сделать тезаурусы: англичане и французы. Немцы ниасилели. Немцы! Конечно, для русского языка полноценного тезауруса тоже нет. Есть разные т.н. идеографические словари (Баранова и др.), но тезауруса — нет. Наверно, нам могли бы его сделать немцы, как и всю нашу лингвистику, но они же и себе его сделать не смогли… Так что замах у Абби, конечно, грандиозный. Вполне может быть, что через 150 лет… хотя нет, уже раньше, 15 лет ведь уже прошло… Тут ещё хотелось бы понимать, у чего скорость выше: у 300 лингвистов Абби, которые день и ночь как проклятые описывают языки (свой язык смыслов и соответствующие его проекции на языки народов мира), или скорость изменений у языков и представлений о мире у человечества. Я бы поставил на скорость изменений. Условно говоря, скорее всего, количество новых понятий, значений, их фреймов и связей во всех языках и в ментальном пространстве человечества на всей планете появляется в секунду больше, чем их описывают за ту же секунду 300 лингвистов Абби на севере Москвы.

  • Ответить
    Альтер Эго

    Вот она где, Истинная Прага: http://anti-malware.ru/news/2012-03-07/8620 «…Одним из важнейших нерешенных вопросов, связанных с Duqu, является то, как эта троянская программа обменивалась информацией со своими командными серверами (C&C) после заражения компьютера-жертвы. Модуль Duqu, отвечающий за коммуникацию с командными серверами, является частью его библиотеки с основным кодом (Payload DLL). При детальном изучении данной библиотеки эксперты «Лаборатории Касперского» обнаружили, что часть её кода, отвечающая за коммуникацию с командным сервером, написана на неизвестном языке программирования, и назвали этот участок «Фреймворк Duqu». В отличие от остального кода Duqu, Фреймворк Duqu не написан на языке C++ и скомпилирован не при помощи Microsoft’s Visual C++ 2008. Возможно, авторы использовали собственные средства разработки для генерации промежуточного кода на C, либо они использовали совершенно иной язык программирования. В любом случае, эксперты пришли к выводу, что язык является объектно-ориентированным и оптимально подходит для разработки сетевых приложений. Язык, использованный в Фреймворке Duqu, является высокоспециализированным. Он позволяет Payload DLL работать независимо от остальных модулей Duqu и обеспечивает подключение к выделенному командному серверу несколькими способами, в т.ч. через Windows HTTP, сетевые сокеты и прокси-серверы. Он также позволяет библиотеке обрабатывать прямые HTTP-запросы от командного сервера, незаметно пересылает копии украденных данных с зараженной машины на командный сервер и даже может доставлять дополнительные вредоносные модули на другие компьютеры в составе сети, т.е. создает возможность контролируемо и скрытно распространять заражение на другие компьютеры. «Учитывая масштаб проекта Duqu, весьма вероятно, что созданием Фреймворка Duqu занималась совершенно другая команда – не та, что разрабатывала драйверы и писала эксплойты для заражения системы, – считает Александр Гостев, главный антивирусный эксперт «Лаборатории Касперского». – Принимая во внимание чрезвычайно высокий уровень кастомизации и эксклюзивности, имевший место при создании языка программирования, можно предположить, что он был разработан с целью не только затруднить понимание сторонними лицами особенностей операции по кибершпионажу и взаимодействия с командными серверами, но и отделить этот проект от работы других групп, участвовавших в создании Duqu и отвечавших за написание дополнительных элементов вредоносной программы». По словам Александра Гостева, создание специализированного языка программирования демонстрирует высочайший уровень квалификации разработчиков, участвовавших в проекте, и указывает на то, что для его реализации были мобилизованы значительные финансовые и людские ресурсы.

  • Ответить

    Речь ведь идёт о прагматике, модели мира, понимании того, как устроен мир и связаны между собой его части в уме человека. Это же самая сложная умственная работа на свете: раскладывать окружающий мир по полочкам. Ну вот собственно мне и показалось что Эбби претендует на то, что они это автоматизировали. Что с точки зрения невежественного либерала примерно соответствует заявлению что они решили NP-полную задачу брутфорсом. То есть досчитали типа до конца бесконечности. При этом я инстинктивно понимаю что количество новых понятий, значений, их фреймов и связей во всех языках и в ментальном пространстве человечества на всей планете появляется в секунду больше, чем их описывают за ту же секунду 300 лингвистов Абби на севере Москвы. Мне почему-то кажется что попытка создать «компилятор» с естественного языка похожа на подбор пароля из бесконечного количества символов брутфорсом. Наверное надо сначала научить компьютер полноценно учиться, а потом просто научить его языку (интересно, возможно ли это без необходимости учить его любить жену, Родину, Партию и ненавидеть пиндосов и агентов госдепа). Люди с Аспергером вполне же коммуницируют (просто им это не очень хочется делать с людишками).

  • Ответить

    Про тезаурус я, кстати, не очень понял. Допустим, Эбби получило грант не от скольково, а от цереу (NSA на самом деле, конечно) и делает все то же самое в гораздо лучшем калифорнийском климате при наличии английского тезауруса Роже. И что, им это сильно поможет?

  • Ответить
    Игорь Ашманов Сам себе компания

    То есть досчитали типа до конца бесконечности. Если присмотреться к натуральным числам, становится ясно, что есть у бесконечности начало, нет у бесконечности конца. Но, как известно, Чак Норрис досчитал до бесконечности дважды. Но никто из Абби никогда и не говорил, что они там что-то такое автоматизировали. как можно автоматизировать описание смыслов? Напротив, эти прагматики-фреймы-деревья они пишут руками. Руками. Пишут. На специальном языке смыслов. Каузируют фреймы акторов и валентностей. Есть, видимо, теория, что когда-нибудь возможные фреймы закончатся или хотя бы будут исчислены все статистически значимые. Потому что якобы ситуаций и отношений предметов между собой и предметов к человеку — сильно конечное число. И у всех людей в мире ситуации примерно одни и те же. Что касается тезауруса, то вряд ли он полезен для этой задачи МП и прочего. Это была просто иллюстрация того, что описание рубрик реального мира (точнее того, как человек в уме делит этот реальный мир на рубрики) — крайне сложная задача. Она сложная не механически, не по ресурсам, деньгам-рукам-времени, а просто интеллектуально сложная. Похожая задача — каталоги Интернета, которые в конце концов стали запутанными и не очень пригодными для навигации. Потому что критериев классификации много, они путаются, пересекаются и противоречат. И в определённый момент моск архитектора этой классификации — отказывает, не справляется. Полочек в голове начинает не хватать, потому что размерность задачи больше размерности одной человеческой головы.

  • Ответить
    Альтер Эго

    Ashmanov, а расскажите о компании Цезурити, кто это и чем занимаются? Вроде какие то облака, активирусы, ИИ и прочее мелькает у них, народ нанимают на хорошие зарплаты, в сколково участвуют, а что именно делают не ясно. [URL=http://www.sk.ru/ru-RU/Community/Participants/IT/Cezurity.aspx]http://www.sk.ru/ru-RU/Community/Participants/IT/Cezurity.aspx[/URL]

  • Ответить
    Альтер Эго

    интернет говорит, что это некто Алексей Чалей с компанией(теперь бывшей?) online-solutions.ru , показывающая некогда неплохие результаты с их антивирусом Online Solutions Security Suite 1.5: [URL=http://www.anti-malware.ru/antivirus_self_protection_test_2010]http://www.anti-malware.ru/antivirus_self_protection_test_2010[/URL]

  • Ответить
    Альтер Эго

    Капрал Швейк, свой собственный язык, компилирующийся в некоторое подобие байткода для виртуальнйо машины, есть и в ЛК. Он не имеет никаокго отношения к Праге или ЕКе, разрабатывается независимо и активно использется внутри движка.

  • Ответить
    Игорь Ашманов Сам себе компания

    Цезурити — питерская компания, бывшая Online Solutions, делает поведенческий антивирус. То есть продукт имеет базу сценариев поведения нехороших программ, которая постоянно пополняется. Вместо сигнатур кода конкретных вирусов — сигнатуры поведения. Это позволяет надеяться на обнаружение новых вирусов без того, чтобы их постоянно догонять, как антивирусы на сигнатурах. В условиях, когда вирусы генерируются автоматически с автоматической же проверкой на всех известных антивирусах, и за год появляется 3 миллиона новых вирусов, такой подход имеет больше шансов, по мнению Чалея и компании. Конечно, обычные антивирусы сейчас тоже имеют эвристические модули и поведенческие блокираторы, но здесь это является центром технологии. Инвестирует компанию сейчас Наталья Касперская.

  • Ответить
    Игорь Ашманов Сам себе компания

    Денег у них будет достаточно. Там всё хорошо с бюджетом. Как выяснилось, я проговорился, Наталья пока не афишировала участие. Но слово не воробей (перестаёт быть воробьём через 40 секунд на Роеме). У неё в портфеле несколько компаний по ИБ, пара из них вовсю рекламируются здесь на ЦеБИТе, выставка вообще вся такая публичная и шумная, что я и решил, что про Цезурити тоже уже пресс-конференция была.

  • Ответить
    Альтер Эго

    Пара замечаний для честной публики. То что написал Ашманов про тезаурусы — полная чушь. Там даже невозможно по мелочам возражать — там все аргументы неполные и неточные. При этом, самое смешное, что Ашманов сам вроде все знает, и в клипе про МП весьма здраво говорит, но здесь на Роеме несет что-то запредельное. Тезаурус словарь со связями. Прежде всего синонимичными и иерархическими. Ашманов говорит, что это не нужно при переводе… Сказать, что есть два тезауруса — Роже и Робер… Только немцы и французы… А ворднеты для кучи языков? Размер тезауруса сам по себе не так важен — важна возможность применения в автоматической обработке. А так можно взять биологические, ботанические или медицинские классификации — это мало поможет. И тут мало кто применяет «в лоб», лучшие работы по применению Wordnet густо замешивают фичи и кучу методов машинного обучения. Применение тезаурусов и других подобных ресурсов — это дополнительные полезные факторы, само по себе панацеей не является. Поэтому и заявления Абби выглядят неправдоподобными. Люблю примеры от разработчиков. Пример тезауруса/таксономии от Абби показывает, что у них все плохо с качеством ресурса. Многозначность зашкаливает, а методы ее разрешения пока недостаточно совершенны. Синтаксис, на который они пытаются опереться, внесет больше ошибок чем пользы.

  • Ответить
    Глеб Суворов https://t.me/itsocial

    ну фиг знает, я не лингвист, чисто с прикладными целями юзал ворднеты — там мало слов. они мелкие. даже для английского языка. а по остальным — ну немножечко совсем слов.

  • Ответить
    Игорь Ашманов Сам себе компания

    Конечно же, я несу запредельную чушь, а альтерэги как всегда знают лучше. Ну так это каждый раз, так что можно даже специально не упоминать. Только мне непонятно, против чего вы согласны. Вы согласны против того, что существующие тезаурусы можно или нельзя применять для МП? Ну покажите работающий МП, использующий тезаурусы. Чтоб дать ему страницу текста и получилось лучше, чем у Гугла. Я несколько раз видел попытки применять тезаурус (синонимы, антонимы, родственные слова, гипонимы, гиперонимы) в поиске, для «расширения запроса». Всякий раз была абсолютная, апокалиптическая катастрофа с релевантностью. И от тезауруса в брюхе поисковика отказывались. Тезаурусы, доведённые до состоянии книги, есть только у французов и англичан. Естественно, это другая задача языковой помощи белковому носителю языка или обучаемому, и эти тезаурусы использовать напрямую в прикладной лингвистике нельзя. Или вы возражаете против за то, что можно применять Wordnet? И на первый взгляд, и на пристальный, Wordnet — помойка. Если бы вы с нею работали, вам было бы это очевидно. Я — работал. Причина, как всегда в том, что архитектура любого каталога реальной действительности — очень интеллектуально сложная задача. Проекты типа Веб 2.0 или открытого софта очень сложные задачи не решают, они могут стаскивать горы контента в одну неразборчивую кучу. Если нет ну очень интеллектуального вождя, который и отвечает полностью, в одно рыло, за общую архитектуру. Таким способом Википедию или Линукс ещё можно сделать, а вот идеографический словарь смыслов — нельзя, по-моему. «Лучшие работы» по применению Wordnet, насколько я слышал и могу судить, не дали ни машинного перевода в состоянии продукта, и ничего другого работающего. Получение грантов под проекты типа Wordnet — ну да, работает. Или вы вообще протестуете за родо-видовые, причинно-следственные и прочие иерархические связи? Ну да, они иногда годятся для работы. Вообще никакие понятия нельзя организовать плоским списком. И что? Или вы против того согласны, что Абби сделало хорошую структуру понятий? Да, это стоило бы разобрать подробнее, только ведь мы не видели этой структуры понятий. Скриншоты помогают мало. Здесь нам незнание многих фактов об Абби смягчит знание немногих принципов об этой предметной области вообще. Например, того, что никто ещё в мире не создал сколько-нибудь приемлемого каталога, тезауруса или сети понятий.

  • Ответить
    Альтер Эго

    Ну покажите работающий МП, использующий тезаурусы. Чтоб дать ему страницу текста и получилось лучше, чем у Гугла. PROMPT-TRADOS с соответствующими модулями расширения Я несколько раз видел попытки применять тезаурус (синонимы, антонимы, родственные слова, гипонимы, гиперонимы) в поиске, для «расширения запроса». Всякий раз была абсолютная, апокалиптическая катастрофа с релевантностью. И от тезауруса в брюхе поисковика отказывались. Яндекс в своем «Спектре» по сути применяет, сначала было все «машинно» и не очень хорошо, сейчас подчистили и поднастроились — стало получше.

  • Ответить
    Игорь Ашманов Сам себе компания

    PROMPT-TRADOS с соответствующими модулями расширения Думаю, это сильное преувеличение. Уж система переводческой памяти Trados тут точно не при чём. Да и в ПроМТе что-то мне как-то сомнительно наличие тезауруса. Там есть свой способ, старинный казацкий, расширенные сети переходов. Ещё со времён Пиотровского. Впрочем, я давно с ними не разговаривал. Яндекс в своем «Спектре» по сути применяет, сначала было все «машинно» и не очень хорошо, сейчас подчистили и поднастроились — стало получше. А опять-таки, сомнительно. Такого вот развесистого тезауруса там точно нет. распознавание тематик для кластеризации результатов — наверно, есть. Вот здесь http://clubs.ya.ru/company/replies.xml?item_no=32028 написано только о распознавании тематик по набору категорий (к которым, видимо, приписаны типовые интенции). Наверно, они ещё дообучают эти категории на статистике. Это к тезаурусам, онтологиям и пр. «вычислению смысла» имеет мало отношения, хотя тематики могут быть объединены в дерево или лес. Скажем, у нас в «Семантическом зеркале» для русского языка — около 3500 рубрик с семантическими образами для распознавания. Конечно, это развесистое дерево, местами изрядной глубины, что видно, например, в диагнозе под данному топику: Демонстрация технологии «Семантическое Зеркало» Семантическое зеркало документа roem.ru/2012/03/02/addednews43665/?c#message120937 Категория Название Вес SciTech-Science Наука 59.2% Economics Экономика и бизнес 56.3% SciTech-Technics-CompInt-Internet Интернет 55.9% Obscene Брань 10.6% Но это именно автоматическая классификация документов, а не «разбор смысла» и всё такое.

  • Ответить

    > Наверное надо сначала научить компьютер полноценно учиться, а потом просто научить его языку Машину надо научить полноценно записывать ей сказанное. А потом сказать нужные слова. Причем первая задача легче. Мне даже верится, что я знаю решение. Но вторая — это большая проблема, которую эбби типа как-то решил. Только я не пойму, с какой целью они намекают, им чего, опять деньги налогоплательщиков потребовались?

  • Ответить

    интересно, можно ли уложить все связи между понятиями в иерархическую модель, как на скриншотах? обычная житейская логика подсказывает что там должен быть как минимум иерархический граф, у ребер должен быть вес, а их количество должно стремится в бесконечность

  • Ответить
    Игорь Ашманов Сам себе компания

    Там дело не в количестве рёбер. Оно, конечно, велико. А в том, что граф — не плоский, а многомерный. Он принципиально не ложится на плоскость. И у него неизвестная, но очень большая размерность. А человек не может умом охватывать сильно многомерные структуры. Если вы когда-нибудь пытались упорядочить хотя бы товары в интернет-магазине или сайты в интернет-каталоге, вы об этом знаете. С чего начинать классификацию? С географии, цены, тематики, бренда, продавца? А ведь в каждом случае возникает своё дерево, которое ещё и пересекается с другими частично, не по всем листьям. Обычно для товаров в интернет-магазинах оставляют одно дерево (гибридное, смешанное из тематики и брендов — Бытовая техника/Телефоны/Смартфоны/Самсунг/модель), а остальные деревья забывают. Причём там тоже куча концептуальных проблем: включать в дереве разделение по брендам ДО разделения на планшеты, смартфоны и просто телефоны, или после? А что делать с листом Samsung Note? Сначала делим PC на ноутбуки и десктопы и потом на Lenovo/Sony, или наоборот? Планшеты к телефонам относим или только к компьютерам? А всё остальное вообще не классифицируют: просто записывают все параметры (гео, цена, название, модель, бренд, продавец, наличие доставки, …) в отдельные поля записи в базе данных и дают возможность пользователю на сайте делать выборки или сортировать по любому полю. Ну и представьте себе, сколько классификаций есть для слов и понятий. Это же не товары (точнее, товары — тоже входят, это же тоже слова и понятия, но это мельчайшая часть этого моря классификации). В принципе, можно было бы тоже записывать параметры к словам/понятиям в БД, чтоб не морочиться графами, однако число параметров заранее неизвестно, разомкнуто. Да и структуру таблиц заранее хрен продумаешь. Раньше была идея XMLьных баз данных, когда ты приписываешь объекту любые поля, а не только те, которые есть в таблице: ставишь любые XML-пометы (поля), которые только что пришли в голову, кидаешь записи в общую кучу, а потом постепенно пишешь процедуры обработки и сортировки для новых помет. Ну и пока индексируешь всё как текст. И пометы становятся «видимыми» либо при поиске, либо когда появилась процедура обработки/сортировки именно для этой пометы. В этом стиле можно было бы описывать понятия, не рискуя, что у архитектора системы зайдут шарики за ролики (как при многомерной иерархии), однако процесс придумывания новых помет рискует не сойтись. Есть подозрение, что множество семантических помет по мощности равно самому множеству понятий. По крайней мере опыт «Толково-Комбинаторного Словаря» Мельчука по модели Смысл-Текст показал, что вначале множество лексических функций (по сути семантических помет для глаголов) бурно расходится.

  • Ответить

    > у него неизвестная, но очень большая размерность. > А человек не может умом охватывать сильно многомерные структуры. хм.. как показыает практика, человек мыслит именно такими структурами.. а то, что на уровне включения логики не все могут это охватить.. так и многие (очень большинство) и не понимают геометрию Лобачевского.. что не мешает им понимать и речь, и устройство мира с кучей x-мерных связей.. и, кста, скорее ответ именно в этом — размерность такого графа по факту не ограничена — и не надо..

  • Ответить
    Альтер Эго

    Продолжим… Честно говоря, скучно писать, так как походя «глубокомысленно» обсуждаются реальные проблемы с соответсвующими «глубокими» выводами. Кто хочет разобраться — надо читать специальную литературу. Онтологии, формальные и прикладные, лексические/лингвистические, тезаурусы и классификаторы и т.д. Не забывая одновременно про машинное обучение, HMM, CRF и т.п. Так как проблемы реальные, то существует несколько разных подходов. Правильное рассмотрение требует анализа и обощения всех. Но есть правильный вопрос, который можно поставить, чтобы получить ответ по тематике этого форума. Вопрос такой — а зачем описывать все «абсолютно», ведь можно описать приближенно (кстати, многие NP-полные задачи имеют очень простые приближенные решения). А если так, то можно ограничиться либо необходимостью описывать только верхнюю часть частотного списка, либо основными фасетами, либо ограничить набор отношений. И загнать все в какой-нибудь gbm, например Матрикснет. Сейчас все так и делают. Во многих задачах работает.

  • Ответить

    не, «читать» не надо.. надо «прочитать».. выводы достаточно простые: семантическая структура простого предложения сводится к конечному набору вариантов графа.. факт же? и не так мго вариантов.. структура сложного предложения и связанного текста сводится тоже к конечному количеству вариантов связей простых предложений.. правильно построить этот граф — это да, задача, но выполнимая.. а вот онтология понятий, которыми оперируют структуры предложений — условно бесконечна.. и да, для обработки смысла машиной лучше поставить ограничение грубины.. и всё работает, и всё замечательно

  • Ответить
    Игорь Ашманов Сам себе компания

    Нельзя ли пальцем показать, у кого замечательно работает и где именно? А вот за «ограничение грубины» — спасибо, это свежий метод, явно перспективный.

  • Ответить
    Игорь Ашманов Сам себе компания

    Кто хочет разобраться — надо читать специальную литературу. Онтологии, формальные и прикладные, лексические/лингвистические, тезаурусы и классификаторы и т.д. Не забывая одновременно про машинное обучение, HMM, CRF и т.п. Мне кажется, вы путаете горячее с многомерным. Мы обсуждаем устройство предметной области и задачи работы с ней, а вы — частные инструменты. Как если бы мы обучались в художественной школе, где нам бы учителя рассказывали про линию, форму, анатомию, композицию, цвет, историю искусств, постановку руки, а вы бы талдычили: да чего там, надо почитать специальную литературу про кисти, резцы, номенклатуру холстов, про краски почитать, как сделать самому мольберт, надо разобраться, в общем. Если не понимаешь, что ты делаешь и зачем, изучение инструментов ничем не поможет. Хоть гору инструментов собери в мастерской, если нет в голове плана будущего произведения и нет умения-таланта, ничего не выйдет. Если не понимаешь, что такое релевантность, что такое интенции пользователя, что вообще пользователь делает на поисковике и зачем, как устроен грязный Веб, не поможет никакое машинное обучение. Или вот не будем далеко ходить за примером, возьмём проект Компрено. Даже оставим в стороне неявные, недоказанные и сомнительные предположения, на которых они строят свой проект — о существовании семантических инвариантов для всех языков, об исчислимости их (за разумное время) и т.п. Спросим просто: что за систему они делают? Какую задачу решают? Вообще говоря, из всех интервью и пресс-релизов про 7 этажей, 15 лет и 70 миллионов долларов понять про задачу, как ни удивительно — нельзя. Нельзя же считать постановкой задачи восторженную пургу типа «щас опишем всё и потом будем делать, что захотим: распознавание речи, перевод, ответы на вопросы!»… И это отсутствие постановки — крайне странно для коммерческой компании, которая выпускает коробочные продукты, по версии в год, с техподдержкой, офисами и дистрибуторами в разных странах и т.п.

  • Ответить
    Альтер Эго

    не, «читать» не надо.. надо «прочитать».. выводы достаточно простые: семантическая структура простого предложения сводится к конечному набору вариантов графа.. факт же? и не так мго вариантов.. структура сложного предложения и связанного текста сводится тоже к конечному количеству вариантов связей простых предложений.. правильно построить этот граф — это да, задача, но выполнимая.. а вот онтология понятий, которыми оперируют структуры предложений — условно бесконечна.. и да, для обработки смысла машиной лучше поставить ограничение грубины.. и всё работает, и всё замечательно Все наоборот — «онтология понятий» может быть описана приближенно (хотя это, действительно, одна из самых фундаментальных проблем). Есть разные подходы. Есть способы сокращения количества понятий в теории FCA. Есть и внешне другой — с опорой на «гипотезу Сепира-Уорфа» — «не нужны другие понятия, кроме тех, что живут в языке». В общем, все та же частотность может дать приближение к нужной степени аппроксимации. А вот с «синтаксическим графом» все плохо в плане его «конечности». Во-первых, многозначность дает совершенно противоречивые результаты («голубые ели»[, пили и спали]). Во-вторых, смысл предложения зависит часто от всего текста. Ну и главное, синтаксис также зависит от «онтологии понятий». А смысл предлжения/текста — даже от «онтологий» — «онтологии» автора, читателя, самого текста. Все вместе они пересекаются в общем межчеловеческом обмене информацией. Что, опять-таки, лучше всего аппроксимируется частоткой.

  • Ответить
    Альтер Эго

    Кто хочет разобраться — надо читать специальную литературу. Онтологии, формальные и прикладные, лексические/лингвистические, тезаурусы и классификаторы и т.д. Не забывая одновременно про машинное обучение, HMM, CRF и т.п. Мне кажется, вы путаете горячее с многомерным. Мы обсуждаем устройство предметной области и задачи работы с ней, а вы — частные инструменты. Ну-ну. Давайте поговорим про «устройство предметной области и задачи работы с ней» без онтологий и/или машинного обучения. Сами то поняли, что завернули в полемическом задоре? Без этих двух «инструментов» остается только невнятный «контекст», анализ которого опять — «онтологии» и «машобучение». Ах да, еще древние предикаты — красиво, но мертво. Я думаю, Вы сами знаете, что область «обработки текстов», и особенно то, что называется «искусственным интеллектом» (где Вы, оказывается, «большой специалист»), сильно страдает от безответственных заявлений. Типа — «завтра все зарулим». В этих условиях все надо проверять. И проверяют вполне ограниченным набором инструментов. И прогресс в этих «инструментах» именно все и определяет. А бизнес — бизнес живет по своим законам.

  • Ответить
    Игорь Ашманов Сам себе компания

    И прогресс в этих «инструментах» именно все и определяет. Это заблуждение. Такое типично программистское заблуждение. Для начала надо понимать, а трясти — уже потом. И ещё вы, кажется, путаете инструменты оценки и инструменты делания. ез этих двух «инструментов» остается только невнятный «контекст», анализ которого опять — «онтологии» и «машобучение». Без этих инструментов остаётся то же, что и было раньше — задача обработки текстов. Которая решается и без автоматического обучения (моды последних десятка лет) и без «онтологий», что вообще не инструмент (как то же машинное обучение), а прямое шарлатанство.

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну-ну. Давайте поговорим про «устройство предметной области и задачи работы с ней» без онтологий и/или машинного обучения. Ну вообще я готов обсуждать достижения старых немцев или новых французов без обсуждения колонковых кистей или подглазурной пастели.

  • Ответить
    Альтер Эго

    Ну, Ашманов, это старый анекдот. См. в новой интерпретации: [URL=http://oper.ru/video/view.php?t=372]http://oper.ru/video/view.php?t=372[/URL]

  • Ответить

    > Нельзя ли пальцем показать, у кого замечательно работает и где именно? да вон у Яндекса.. «когда дадут горячую воду» «онтоология это» «что значит [какая-нибудь хрень]» вполне замечательно определяют смысл.. йо-йо, смысл.. запроса а ограничение глубины — это моя програмисстскость, надо же где-то рекурсию останавливать :)

  • Ответить

    между прочим, про «голубые ели» — это как раз иллюстрация того, что не надо на машину вешать слишком много.. ибо суть анекдота именно в неоднозначности восприятия такого смысла человеком даже.. те, кто в школе язык учил, помнят упражнения типа > Без языка и колокол нем > Хороша у Алены коса. И трава на лугу ей по косу. Скоро лугом пройдется коса: Приближается время к покосу и т.п. Кому придет в голову учить машину разбираться в том, в чем человек не сразу разбирается?!..

  • Ответить

    не, вот прикольнее: он же всю ночь порол чушь.. чушь тихонько похрюкивала.. тут сразу и чушь — не чушка, хотя человек поймет.. и вариант «похрюкивала от удовольствия» — на эвфемизм (или че тут?) «пороть».. а еще недавно где-то прочитал «трахнуть дверью».. ужас, но не сразу правильно осмыслил..

  • Ответить

    Всю эту перечисленную хрень тоже можно научить разбирать. Только учить очень долго и нудно придется. Единственное ограничение — это принципиальная неразрешимость, как с примером про «голубые ели». Друзья, у меня реально есть решение, ну, тот граф о котором вы говорите. Проблема в том, что без введеных данных найденная структура мало кому нужна. Подскажите как обналичить, плз.

  • Ответить
    Игорь Ашманов Сам себе компания

    Она, структура, возможно, и с введёнными данными тоже будет не нужна. Тут есть некая печальная закономерность, наводящая на грустные мысли. Все городские сумасшедшие, обещающие решение сразу всех задач прикладной лингвистики, обычно тоже имеют свою собственную нотацию/структуру/язык описания. Вот так обозначаем глагол, вот тут у нас продукция, тут квантор, а вот здесь рёбра графа с весами… Остаётся только дать денег на то, чтобы это всё заполнить данными. Как раз до пенсии. Проблема в том, что любая нотация ничего не решает. И имеет свойство затуманивать разум людям с самолюбием. Типа, мысли редко заходят, а тут такая крупная, своя! По сути, тот же механизм, что у графоманов.

  • Ответить

    Интересно, имеет ли смысл вообще скармливать машите тексты типа Настанет день и час любовь к тебе придёт Зови иль не зови Где встретишь ты её не знаешь наперёд Темны пути любви Неслышен её шаг неведомы черты Таинственен язык Ну вот пришла любовь её узнаешь ты Узнаешь в тот же миг Ла-ла-ла-ла ла-ла-ла-ла узнаешь в тот же миг.. Особенно это «ла-ла» :)

  • Ответить

    Я думаю, Игорь, задача поиска денег в принципе решается. Надо убедить заинтересованных инвесторов так, как икомбинатор убедил Мильнера. Типа дай бабла просто так, по-любому не прогадаешь, просто потому что мы крутые. Но чтоб так убедить, надо попотеть. Вот и мучаюсь, бляха.

  • Ответить
    Игорь Ашманов Сам себе компания

    Интересно, имеет ли смысл вообще скармливать машите тексты типа Настанет день и час любовь к тебе придёт Зови иль не зови Где встретишь ты её Конечно, нет. Такие тексты машина должна писать сама. Читай Сказки роботов про приключения Великих конструкторов Трурля и Клапауциуса.

  • Ответить

    > Если вы когда-нибудь пытались упорядочить хотя бы товары в интернет-магазине или сайты в интернет-каталоге, вы об этом знаете. С чего начинать классификацию? С географии, цены, тематики, бренда, продавца? А ведь в каждом случае возникает своё дерево, которое ещё и пересекается с другими частично, не по всем листьям. Обычно для товаров в интернет-магазинах оставляют одно дерево (гибридное, смешанное из тематики и брендов — Бытовая техника/Телефоны/Смартфоны/Самсунг/модель), а остальные деревья забывают. > Причём там тоже куча концептуальных проблем: включать в дереве разделение по брендам ДО разделения на планшеты, смартфоны и просто телефоны, или после? А что делать с листом Samsung Note? Сначала делим PC на ноутбуки и десктопы и потом на Lenovo/Sony, или наоборот? Планшеты к телефонам относим или только к компьютерам? Проблемы с классификацией бывают, только когда считают, что классификация это «вещь в себе». А это не так, классификация зависит от предметной области, где ею будут пользоваться. Поэтому надо идти «с конца» — определить круг пользователей, для кого классификация делается, узнать что и как они будут искать, а потом под их потребности составлять каталог. Если короче: смысла в классификации ровно столько, насколько она помогает конечному пользователю. Больше никакого скрытого смысла в ней быть не может. Может все это банальность, но возникает впечатление, что лингвисты придают классификации некий сакральный смысл (медики кстати тоже, это еще Фейнман хорошо описал) > Раньше была идея XMLьных баз данных, когда ты приписываешь объекту любые поля, а не только те, которые есть в таблице: ставишь любые XML-пометы (поля), которые только что пришли в голову, кидаешь записи в общую кучу, а потом постепенно пишешь процедуры обработки и сортировки для новых помет. Ну и пока индексируешь всё как текст. И пометы становятся «видимыми» либо при поиске, либо когда появилась процедура обработки/сортировки именно для этой пометы. Это и сейчас есть, XML тут и не нужен, делается и на классической реляционной ДБ, многие интернет магазины используют такие структуры, называется [URL=http://en.wikipedia.org/wiki/Entityattributevalue_model]Entity–attribute–value model[/URL]

  • Ответить
    Игорь Ашманов Сам себе компания

    А это не так, классификация зависит от предметной области, где ею будут пользоваться. Поэтому надо идти «с конца» — определить круг пользователей, для кого классификация делается, узнать что и как они будут искать, а потом под их потребности составлять каталог. Главная проблема прикладной лингвистики в том, что у неё нет «круга пользователей». То есть общение с компьютером на естественном языке, для чего нужны переводчик, распознавание речи, виртуальный собеседник или проверка правописания, может вести любой носитель языка. Из-за этого возникает проблема гигантского разнообразия входных данных. Спрошено может быть что угодно и в любой форме. Конечно, если дизагрегировать задачу, сузить её до подзадачи подзадачи подзадачи, например, заказ билета по телефону, то как-то, с каким-то качеством решить её можно. Если короче: смысла в классификации ровно столько, насколько она помогает конечному пользователю. Больше никакого скрытого смысла в ней быть не может. Это верно. Но что делать тем, кто делает машинный переводчик для любых текстов? Может все это банальность, но возникает впечатление, что лингвисты придают классификации некий сакральный смысл Ну так если речь идёт о смысловой классификации всего видимого и слышимого мира (а меньше нельзя, если делаешь системы «для всего»), то это, конечно, сакральная задача, которую раньше решали жрецы и философы. А сейчас нимало сумняшеся берутся решать малообразованные программисты, думающие, что всё дело в правильном наборе инструментов, про которые можно почитать в Интернете.

  • Ответить
    Игорь Ашманов Сам себе компания

    И кстати, это порождает другую структуру проблем многих систем прикладной лингвистики в плоскости «полнота-точность», чем, например, во всем привычном поисковике. Поисковик проблема полноты не волнует вообще (всё равно пользователю будет сообщено, что найдено стопиццот миллионов страниц), а волнует проблема точности первой десятки результатов. А системы типа диалога на ЕЯ, вопросов-ответов, распознавания речи или проверки правописания не волнует точность: если подходящие шаблон-фрейм-дерево найдены, то ответ практически всегда будет точным. А вот проблема полноты стоит во весь рост: из-за того, что спрошено может быть что угодно, распознавание знакомого в этом разнообразном потоке является главной проблемой. Для машинного перевода это тоже верно, хотя внешне кажется, что главное в МП это точность — вот же оно переводит криво, «неточно».

  • Ответить
    Альтер Эго

    > Поисковик проблема полноты не волнует вообще Чушь. Поисковики проблема полноты волнует очень сильно. Ибо если ты не найдешь того, что хотел пользователь (потому чт ов базу не попало или потому что запрос правильно понять не смог), а конкурент найдет, пользователи будут считать лучшим поиск конурента. С простым арументом «я там запрос ввожу- и он находит. а тут — фигня какая-то»

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну естественно, все пишут чушь, кроме альтерэги-программиста. А уж я пишу чушь в каждой букве. Мне кажется, вы всё-таки пишете, не подумав предварительно хотя бы 2-3 минуты. Полнота реально влияет там, где результатов изначально мало. Это довольно редкая ситуация. В остальных случаях влияет ранжирование найденного, то есть точность. Полнота реально видна в поиске по блогам (где на неё влияет скорость, где актуальных постов немного и, скажем, ППБ часто реально лажает, не находит вообще), в поиске картинок, где, например, у Гугла полнота явно выше. Но не в обычном текстовом поиске, да ещё если запрос информационный. Там для большинства запросов контента, который не только формально соответствует запросу, но и реально отвечает на вопрос — море. Его только надо ранжировать правильно. Скажем, обеспечивать не только релевантность первой позиции, но и тематическую «спектральность» остальных девяти. Это другая задача, не полнота.

  • Ответить
    Альтер Эго

    > Полнота реально влияет там, где результатов изначально мало. Это довольно редкая ситуация. Опять чушь. Вам нравится писать чушь? На запрос «вконтакте» правильный результат вообще один. Угадайте, что случится, если его не будет? Еще примери привести или сами найдете? Редкая ситуация такая редкая.

  • Ответить
    Альтер Эго

    > Полнота реально влияет там, где результатов изначально мало. Это довольно редкая ситуация. Ржем всем офисом. Про навигационные запросы Ашманов, видимо, не в курсе.

  • Ответить

    >Главная проблема прикладной лингвистики в том, что у неё нет «круга пользователей». То есть общение с компьютером на естественном языке, для чего нужны переводчик, распознавание речи, виртуальный собеседник или проверка правописания, может вести любой носитель языка. Ну я там отвечал насчет классификации для товаров. А насчет классификации для лингвистики, у меня есть подозрение, что классификация отношений между словами вообще ничего хорошего не даст. Это как учить компьютер водить машину через описание всех возможных ситуаций на дороге — возможных вариантов бесконечное множество. Но наверное можно найти минимальное кол-во слов и минимальную грамматику, которой достаточно, чтобы через них определить все другие новые слова и грамматику. Это как у машины фон Неймана — только несколько базовых операций, но поверх них можно надстроить любое кол-во слоев абстракции, любой сложности. Или как базис в линейной алгебре, через которые задается пространство. Если в лингвистике возможно выделить такие базовые понятия, то тогда задача наверно сможет решаться через «обучение». Но боюсь, чтобы выделить такой базис, сначала надо хорошо изучить как вообще работает разум — какие примитивы используются в подсознании, поверх которых существуют слова и грамматика.

  • Ответить
    Игорь Ашманов Сам себе компания

    Ржем всем офисом. Видимо, это офис ипподрома? Добрые, умные гуингмы сожалеют о непонимании йеху. Вам бы надо их покормить. Про навигационные запросы Ашманов, видимо, не в курсе. Что-то слышал. Вот тут вроде про это пишут: http://analyzethis.ru/?analyzer=navig…ru&lang=ru Проблема в том, что поместить ВКонтакт в ответ на запрос «вконтакте» на первое место — не вопрос полноты. Мне кажется, ваши некормленные лошади несколько не вжёвывают, что такое полнота. У них произошло профессиональное смещение. Вы же не хотите поржать на тему, мой добрый гуингм, что в Рунете ровно один релевантный адрес по запросу «вконтакт» и у вас полнота 100%, раз вы его показываете? А зачем же вы тогда показываете пользователю всё остальное, вот так, например (90 миллионов ответов) http://yandex.ru/yandsearch?text=&clid=48648&lr=213 Если же вдруг, паче чаяния, на запрос «вконтакте» есть ещё релевантные ответы, то здесь можно было бы посчитать и настоящую полноту (даже предположить, что кроме 330 миллионов ответов в сети осталось, не нашлось что-то ну очень релевантное, но не найденное).

  • Ответить
    Альтер Эго

    > Вы же не хотите поржать на тему, мой добрый гуингм, что в Рунете ровно один релевантный адрес по запросу «вконтакт» и у вас полнота 100%, раз вы его показываете? Именно это я и хочу сказать. Статистика кликов не врет, знаете ли :) А вы оставайтесь при своем мнении, наш ипподром уже устал над вами смпеяться.

  • Ответить
    Игорь Ашманов Сам себе компания

    А насчет классификации для лингвистики, у меня есть подозрение, что классификация отношений между словами вообще ничего хорошего не даст. Это как учить компьютер водить машину через описание всех возможных ситуаций на дороге — возможных вариантов бесконечное множество. Вот речь не мальчика, но мужа. Но наверное можно найти минимальное кол-во слов и минимальную грамматику, которой достаточно, чтобы через них определить все другие новые слова и грамматику. Это как у машины фон Неймана — только несколько базовых операций, но поверх них можно надстроить любое кол-во слоев абстракции, любой сложности. Или как базис в линейной алгебре, через которые задается пространство. Ну да, но как тогда можно проверить, что это тот базис? Придётся порождать всё возможное и сравнивать с уже порождённым людьми, с текстами. То есть заниматься тем самым кагбэ машинным обучением. Но что делать с той частью ЕЯ, которые ещё не порождён носителями языка, но может ими порождаться и порождается ежесекундно в чудовищных масштабах? Вдруг это делается на не включённых векторах базиса, которые мы забыли? (Скажем, как известно 1960-х годов, разговорная речь имеет другой синтаксис и принципы построения словосочетаний и фраз). Возможно, и это тоже задача решаемая. Но дальше останется интерпретировать, «понимать», отвечать на вопросы и переводить. Как это делать с помощью «базиса»? Но боюсь, чтобы выделить такой базис, сначала надо хорошо изучить как вообще работает разум — какие примитивы используются в подсознании, поверх которых существуют слова и грамматика. Проблема в понимании понимания в том, что для него требуется понимание понимания понимания. Можно ли вообще осознать объект, используя его самого в качестве инструмента осознания — большой вопрос. Неспроста эти слова написал Платон на воротах своей академии 2400 лет назад. (Кстати говоря, «подсознание» вообще ложная модель, которая тут может только запутать. Никакого «подсознания» у человека нет, это фрейдовский фейк.) Хочу по ходу дискуссии обратить внимание, что разговор про прикладную лингвистику и ИИ неизбежно сходится к устройству человека и мира, то есть к сакральным классификациям и смыслам. Обойтись инструментами типа «скачал тут статейку, надо попробовать» — не получится.

  • Ответить
    Игорь Ашманов Сам себе компания

    Именно это я и хочу сказать. Статистика кликов не врет, знаете ли :) Вы не устали говрить банальности? Не приходило ли вам в вашу благородную голову, с рождения не знавшую уздечки, что эти очевидные соображения могли также прийти в голову и грязным йеху? И что эти йеху могли видеть статистику кликов у запросов такого рода, как например, «яндекс», «гугл» или даже yandex.ru в те доисторические времена, когда вы ещё и поиска в копыта не брали? А если это банальная вещь, статистика кликов известна, то что же может меня заставить не понимать очевидного и настаивать на второстепенности полноты для поиска? Очевидно, только невероятная глупость, не свойственная благородным гуингмам! Если мой благородный гуингм устал ржать, может, стоит пойти пожевать?

  • Ответить
    Альтер Эго

    > что же может меня заставить не понимать очевидного и настаивать на второстепенности полноты для поиска? Очевидно, только невероятная глупость, не свойственная благородным гуингмам! Какой вы догадливый! Я бы сюда добавил еще невероятную упертость, характерную для некоторых пород.

  • Ответить
    Альтер Эго

    > поместить ВКонтакт в ответ на запрос «вконтакте» на первое место — не вопрос полноты. Вы не устали говрить банальности? Да, это не вопрос полноты. Вопрос полноты — это то, будет vkontakte.ru в выдаче или нет, а не то, на каком он будет месте.

  • Ответить

    Вспомните передачу «100 к 1». Не проблема угадать то, что должно быть на первом или втором месте. А вот в таких убийственных запросах сформировать выдачу дальше первого места — это уже rocket science Кстати, интересно — кто-нибудь пробовал по таким запросам редиректить юзера на искомый сайт без показа результата выдачи и какова была их реакция?

  • Ответить
    Альтер Эго

    > Гугля вроде пробовал и до сих пор пробует.. > При нажатии «Мне повезет» Идея Юры редиректить всегда, а не если пользователь явно выразил жеоание, чтобы его редиректили. Такого, вроде бы, никто не делал, даже в экспериментах.

  • Ответить
    Игорь Ашманов Сам себе компания

    Да, это не вопрос полноты. Вопрос полноты — это то, будет vkontakte.ru в выдаче или нет, а не то, на каком он будет месте. Вы против чего согласны-то? Я говорил, что полнота не является первым приоритетом для поисковика. И что её обеспечить проще всего. И она поисковик волнует далеко не в первую очередь. Можно сказать, не волнует вообще, ну разве что кроме небольшого отдела, который занят именно ею. Вы там у себя в ипподроме поспрашивайте, за что там вас погонщики поимеют в первую очередь: за отсутствие полноты или за плохую релевантность, она же точность? Все ваши технологии, Великое Машинное Обучение, Великий Поведенческий Анализ и прочее — они для чего делаются, на что направлены, неужели в первую очередь на обеспечение полноты? Типа «чтоб сайты ВКонтакта и Одноклассников были в базе!!!». (Кстати, стоит провести тщательный анализ кликов на наших анализаторах и посмотреть, часто ли смотрят анализатор полноты). Как вы думаете, о знаток кликов, трудно ли обеспечить наличие сайта в ВКонтакте и подобных ему в индексе? Для этого нужны сверхтехнологии и машинное обучение? Вообще, с полнотой есть ли серьёзные проблемы? Да, например, у Яндекса какие-то есть: http://analyzethis.ru/?analyzer=rare&location=ru&lang=ru У него полнота (вычисляемая, конечно, очень косвенно) — пониже, чем у Гугла. Процентов на 10-15%. И что? Но проблемы — точно не по частотным запросам: http://analyzethis.ru/?analyzer=rare&location=ru&lang=ru&date=2012-03-10

  • Ответить
    Альтер Эго

    > Я говорил, что полнота не является первым приоритетом для поисковика. И что её обеспечить проще всего. Э-э-э нет, уважаемый. Говорили вы совсем другое. > Поисковик проблема полноты не волнует вообще А потом уже начали отползать, довольно неуклюже > Полнота реально влияет там, где результатов изначально мало. Это довольно редкая ситуация Про целый класс навигационных запросов, где именно такая ситуация, вы просто забыли в полемическом угаре. Заигрались в аналогии на базе Свифта. Бывает, чо.

  • Ответить
    Альтер Эго

    > Но проблемы — точно не по частотным запросам: Спасибо, Кэп! Перечитайте еще раз нашу беседу, там ни слова нет про то, что полнота важна только по частотным запросам.

  • Ответить
    Игорь Ашманов Сам себе компания

    Я только что написал, что «можно сказать, что не волнует вообще». Зачем заниматься фигурной резьбой по цитатам? Да, поисковик полнота вообще не волнует. Его проблема — точность. Вас полнота чего-то волнует, ну так вы — не поисковик, видимо. Вы лучше ответьте на мои прямые вопросы: выясните там у себя в стойлах, давно ли всех плющили и лишали овса за недостаток полноты. P.S. Вы показали неплохой навык использования информационных запросов — смогли погуглить гуингмов и найти Свифта. Круто, чо.

  • Ответить
    Игорь Ашманов Сам себе компания

    Спасибо, лошадь Кэпа! Копытопожимаю! Но иллюстрировали вы зачем-то очень частотным запросом «вконтакте». Видимо, запросы типа вот этих были бы не столько убедительны в смысле «поисковик страшно волнуется из-за полноты!!!»: 1 автоклитики 1 95-3 81 81 160-19 6 170 2 агриньеит 0 6 15 15 5-1 2 6 3 аинкяга 0 1 5 5 1 2 1 4 акроторациковые 0 335 127 127 158 20 163 5 актиномиксидии 1-1 255+1 220+4 220+4 218+4 23 178-34 6 алетевтика 0 155 37 37 30 5 21 7 альвеопалатальный 0-1 77-1 125 125 157+9 6 137+3 8 антраксолитсодержащий 0 5 2 2 2 3 9 аччакатура 1 171-2 98 98 108+12 18 106+7 10 бециркстаг 0 24-1 18 18 50+10 0 40-6 11 биопустотный 0 320 126 126 68 7 36 12 Биркебейнерреннет 0 104 49+2 49+2 30 4 28-5 13 бодхьянга 1+1 118-2 286+4 286+4 673-5 33 469-193 14 брагопроизводство 0 19 20 20 10 0 12-7 15 Бэкшоринг 0 46 74 74 36 1 40+2 16 Вавертри 0 111 89 89 84 5 92 17 Вагенбауфабрик 0-1 26 10 10 9-1 4 8-2 18 векторограмма 0 202 372+1 372+1 257 18 242-6 19 Вериселен 1 30 7 7 10 3 9-3 20 Вильшталер 0 37-1 29 29 17 4-1 15-1 21 вонтрепренер 0 43 25 25 27+1 3 28-1 22 восточнонумидийский 1 83+1 98 98 74-1 6 70+1 23 гардкрота 0 92-2 468+1 468+1 784+22 3 669-92 24 гексакосиойгексеконтагексапараскаведекатриафоб 0 12 22 22 17 0 16-1 25 гемогомоны 0-1 2 6 6 10+1 1 6-1 26 гетеросистемщик 0 96+1 20 20 1 1 1 27 гиполокрийский 0 6 27+4 27+4 26 1 27 28 гуглгангер 0 9 10 10 5-1 1 5 29 Даунэйджер 0 26 10-1 10-1 16+1 1 16+1 30 дейтафонный 0 356-4 400 400 127-8 3 131-3 31 дейтеротокия 1 133 255-1 255-1 268+19 21 218-3 32 драйверофобия 0 273 98 98 105+20 6 88-2 33 желлетит 1 150 210 210 196 35 199 34 Згоржелецкий 0 23 97+1 97+1 25 3 23 35 инквилинизм 0 555+6 322+3 322+6 344-3 51 260-45 36 какашкофобия 0 104 121-2 121-2 70+10 8 44-12 37 кателектротонус 0 52 0-47 47 119-26 4 142-3 38 киберкейсинг 0 37-3 72 72 10 0 14 39 киссумбо 1 165 23 23 26 5 32 40 клинопинакоид 0 59 269-1 269+1 317+5 5 290-14 41 компреньякит 0 43 36 36 39 4 36 42 кристаллария 0 89+2 122 122 116+5 5 117-7 43 кронарциум 3-1 216+1 79 79 75-5 63 78-5 44 ксантоцианопия 0 62-2 53 53 148-2 3 144-14 45 ксеноконхии 1 308-2 250-16 250-16 402+10 27 381-11 46 ламаркианизм 0 64 55 55 160 3 162 47 линмайли

  • Ответить
    Альтер Эго

    > Вы там у себя в ипподроме поспрашивайте, за что там вас погонщики поимеют в первую очередь: за отсутствие полноты или за плохую релевантность, она же точность? И снова бред. О важности своевременого обнаружения новых страниц и важности качества работы веб-краулера Ашманов походу тоже имеет весьма альтернативные представления.

  • Ответить
    Альтер Эго

    > иллюстрировали вы зачем-то очень частотным запросом «вконтакте». Исключительно чтобы вам было понятнее. Другие примеры я предложил вам найти самостоятельно, вы, я смотрю, не справились. Давайте я вам подскажу «официальный сайт группы ария», ну «hiybbprqag» на хуой конец, ЕВПОЧЯ

  • Ответить
    Альтер Эго

    > Вы лучше ответьте на мои прямые вопросы: выясните там у себя в стойлах, давно ли всех плющили и лишали овса за недостаток полноты Вы такой смешной. Да, недавно. Как раз за то, что vkontakte.ru ненадолго пропал из выдачи по техническим причинам.

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну вот наконец начали проблески понимания возникать. Произнесено ключевое слово — «технический» Мы здесь обсуждаем всякие умные технологии. Релевантность требует именно умных технологий. А полнота индекса их не требует — это чисто техническая вещь. Больше ходить пауком, больше ссылочек в очереди на индексацию, больше покупать серверов, оптимизировать выкачку, индексацию, хранение. Есть ли хоть какая-нибудь вероятность, что ссылка на vk.com или сайт группы Ария НЕ попадёт в задание на индексацию на 14 год существования Яндекса или Гугла? Я поясню для вас, любезные друзья: эта вероятность равна нулю. И даже по новым/редким сайтам полнота индекса достигается чисто техническими средствами (ходим по ссылочкам, анализируем фид с тулбаров и прочих прилад, анализируем фид с контекстных блоков в рекламных сетях, со своей сборки браузера, со своей системы статистики, ну кто как там, в меру понимания и совести). Количество урлов в мире — конечно, методы их получения — известны. При чём здесь технологии? Полнота — не проблема в принципе. Проблема номер 1 — релевантность, затем свежесть, разнообразие выдачи и т.п. В общем, читай список наших анализаторов, что бы примерно понять, что мы думаем про важные вещи в поиске (впрочем, насколько нам известно, понимающих людей в Яндексе этот список и направление развитие этого тестового сервиса тоже устраивает, да и из Мыла больших нареканий на номенклатуру и методики — не бывает).

  • Ответить
    Альтер Эго

    > Количество урлов в мире — конечно, методы их получения — известны. Наш ипподром устал ржать. Пощадите! Что ни фраза то сполшное ЩИТО. Число урлов в мире — бесконечно. Методов их получения много разных и постоянно придумываются новые. Вы просто не интересуетесь или не знаете. Ну вы на досуге подумайте, зачем, например, все так рвутся twitter с фейсбуком индексировать и свои соцсети делать. > При чём здесь технологии? Полнота — не проблема в принципе. Проблема номер 1 — релевантность, затем свежесть, разнообразие выдачи и т.п. Вы повторяйте, повторяйте.

  • Ответить
    Альтер Эго

    > Есть ли хоть какая-нибудь вероятность, что ссылка на vk.com или сайт группы Ария НЕ попадёт в задание на индексацию на 14 год существования Яндекса или Гугла? Придется разжевать, раз вы сами понять не в состоянии: каждый день появляется куча новых «официальных сайтов» или новых страницб либо менются сущестующие, которые, да, могут НЕ попасть в задание на индексацию достаточно быстро. И это только один маленький пример того, почему полнотой поисковики сейчас интересуютя весьма серьезно.

  • Ответить
    Игорь Ашманов Сам себе компания

    Я знал, что вы купитесь на слово «конечное» и начнёте играть мускулами. Ну вы такие умные, гуингмы! Как же вам не ржать. Что ж вы генерацию урлов в базах данных не вспомнили, сессионные идентификаторы? Урлов даже на одном сайте бесконечное число. В потенции. И чо? Того, что надо показывать в выдаче — конечное число. Конечно, можно было бы поржать относительно того, что в каждый момент времени на планете конечное число чего угодно, но с лошадями я не ржу, по принципиальным соображениям. Я начинаю подозревать, что вы сидите где-то в отделе индексации и страдаете от недооценённости вашей полноты. Увы, добывание урлов — не проблема и не вопрос технологии, а всё-таки чисто технический вопрос. Мне жаль вас, благородный гуингм, что вас не берут на настоящие скачки, в битву за релевантность.

  • Ответить
    Игорь Ашманов Сам себе компания

    Придется разжевать, раз вы сами понять не в состоянии: каждый день появляется куча новых «официальных сайтов» или новых страницб либо менются сущестующие, которые, да, могут НЕ попасть в задание на индексацию достаточно быстро. И это только один маленький пример того, почему полнотой поисковики сейчас интересуютя весьма серьезно Пожевать — всегда хорошо, после душевного ржача. Насколько серьёзно? Сколько там новых «официальных сайтов», которые вдруг потерялись? Сотые доли процента или тысячные? Или миллионные? Я понимаю, вы бы заговорили про длинный хвост, про те запросы, которые спрашивают один раз. И про навигационный урл, который должен им соответствовать. Но почему-то вы об этом молчите.

  • Ответить
    Альтер Эго

    > Того, что надо показывать в выдаче — конечное число А начинали горадо бодрее. «Число уров-конечно, методы получения-известны». Вы опять сказали глупость. «Того, что надо показывать в выдаче» — тоже бесконечное (совсем строго — очень большое, можно считать бесконечным) число. Но состояние дел сейчас такое, что индексировать множества урлов как целое мы не можем, приходится мирится с некоторым конечным числом. > Я начинаю подозревать, что вы сидите где-то в отделе индексации и страдаете от недооценённости вашей полноты Подозревайте что вам угодно. С альтерэгами это всегда так интересно, верно? > Увы, добывание урлов — не проблема и не вопрос технологии, а всё-таки чисто технический вопрос. Ну что вы не в теме относительно современных исследований в этой области мы уже поняли, можно не повторять. Сходите вот сюда, почитайте на досуге http://en.wikipedia.org/wiki/Deep_Web может, озарение снизойдет на вас. Хотя я почему-то сомневаюсь.

  • Ответить
    Игорь Ашманов Сам себе компания

    Про глубокий веб пишут уже с 1999 года. Вы что хотели сказать-то? Что вы такие красавцы, в промежутках между постановкой урлов в очередь на индексацию, глубоко вжёвываете в глубокий веб? И скоро начнёте его индексировать даже?

  • Ответить
    Игорь Ашманов Сам себе компания

    Что-то я начинаю узнавать паттерн. У меня тут была как-то забавная история во Вьетнаме, когда там в Министерстве связи мы рассказывали про всякое, в том числе моя жена Наталья сделала презентацию про угрозы. Как обычно. В том числе она сказала в докладе, что по оценке ЛК количество заражённых компьютеров во Вьетнаме выросло вдвое за полгода. И вот тут вьетнамцы настолько напряглись, что мы не могли уйти ещё пару часов. ЛК — компания во Вьетнаме известная и уважаемая, и тут она заявляет, что ситуация в стране ухудшилась вдвое. Вероятно, за такое в стране с твёрдой вертикалью власти можно и партбилет на стол положить. Наши хозяева настаивали, что в отчёте ЛК — ошибка, что в этот раз аналитики не отнормировали оценку на число компьютеров или установок антивируса в стране. И уйти нам не удавалось, так настойчиво хозяева просили разобраться. Самое забавное, что после двух часов телефонных переговоров Натальи с ЛК, через 9 тыщ км, под зелёный чай и фрукты, выяснилось, что таки да, ошибка! Наши вьетнамские хозяева были правы. Так оно и оказалось — не отнормировали. Все выдохнули, стало ясно, что сказать начальству, и мы смогли спокойно пожать руки и уйти. (Кстати, в дальнейшем эта ошибка стала у ЛК привычной, вот как в последнем случае с источниками атак). Вот с этим настойчивым «нет, полнота важна!!!» что-то есть неуловимо знакомое. Похоже, что я сказал что-то крайне неправильное и неудобное с корпоративной точки зрения отдела полноты. И ещё тут за чаем у нас возникло смутное, неясное подозрение, что это ржут гуингмы, ушибленные транспонированием: были они главные в конюшне по полноте в поиске, а стали главными по поиску в полноте. Как тут не заржать.

  • Ответить

    > Гугля вроде пробовал и до сих пор пробует.. > При нажатии «Мне повезет» От «мне повезёт» отказались недавно. Гугл делает лишь предварительную фоновую загрузку первого результата, если практически уверен, что пользователю нужен именно он.

  • Ответить
    Альтер Эго

    > И ещё тут за чаем у нас возникло смутное, неясное подозрение, что это ржут гуингмы, ушибленные транспонированием: были они главные в конюшне по полноте в поиске, а стали главными по поиску в полноте. Надо же. опять неизвестность! Опять догадки! Захватывающе, правда? :)

  • Ответить
    Альтер Эго

    > Похоже, что я сказал что-то крайне неправильное и неудобное с корпоративной точки зрения отдела полноты. Вы просто сказали глупость, разную, несколько раз. Как не поржать. «Отдел полноты» — это что за отдел? В какой компании?

  • Ответить

    > От «мне повезёт» отказались недавно. Валентин, ты не поверишь! Я, прежде чем запостить, не поленился на нее («мне повезет») нажать и убедицца.. Редакция, а как бы реализовать функцию «отписаться от пользователя/альтерэги (конкретного) в этой ветке»? :)

  • Ответить

    > а как бы реализовать функцию «отписаться от пользователя/альтерэги (конкретного) в этой ветке»? :) Могу спросить у программистов сколько это стоит, оплатите — сделают.

  • Ответить
    Альтер Эго

    > Число урлов в мире — бесконечно. интересная у них жизнь. я имею в виду, у тараканов в тыквах. Атомов во вселенной конечное число, а урлов бесконечное.

  • Ответить
    Альтер Эго

    > Атомов во вселенной конечное число вы хотели сказать «в наблюдаемой части Вселенной»?

  • Ответить

    > оплатите — сделают гык.. пришлите мне список ваших туду, и если редакция не против выкинуть битрикс нах — мож, сделаем за копирайты (что вряд ли) или в большую рассрочку большой акцент: _может_, сделаем..

  • Ответить
    Альтер Эго

    > Атомов во вселенной конечное число Вам кто это сказал? Ужас, эти обремененные интеллектом лемминги такие лемминги

  • Ответить

    > нас это не устраивает не удивительно.. но ваще, замечатенльня и далеко не единичная иллюстрация к тому, как некто подсел на Битрикс, ибо «лекго и просто, и секретарша сможет», а потом оказывается, что 5 галочек на пяти формах вставить оказывается по цене столько же, скока всё заново написать.. Юр, я не для понтов, я для прояснения — нет, не так?

  • Ответить
    Альтер Эго

    Вселенная, как мы знаем, конечна. Кроме того. Произошла она из Большого взырва, как верят физеки. При Большом взырве не могло образоваться бесконечное число частиц. Поскольку сам Большой взырв конечное явление, с конечной мощностью и все такое.

  • Ответить

    ну да, посмотрел бы с большим любопытством.. хотя, если «спросить у программистов» = спросить у Олега и его команды, то да, логично, такой квалификации работа даже «поправить галочки» сильно дорого получется.. тем более — поправить под Битрикс :)

  • Ответить
    Альтер Эго

    > Вселенная, как мы знаем, конечна Вас глубоко небибали. Конечна толька клетка хомяка. Вы поменьше физиков слушайте, у них и руины говорят, и собаки лают, и струны струят

  • Ответить

    Элементарно, мой милый Хомоватсунос: конца у Вселенной нет, ибо его никто не щупал, не видел, не нюхал. Теперь Ваша очередь — докажите, что он есть. А если не сможете — Вы лоханулись, ляпнув «известно»

  • Ответить
    Альтер Эго

    Конец у Вселенной уже обнаружен физеками. Оне пишут, что она конечна. И предлагаю вам врюхать в концепцию большого взырва: он же не мог быть бесконечным взырвом? Значит, при его взырвании выделилось конечное количество всего.

  • Ответить

    не знаю.. я лично никаких краев не видед.. намного больше людей говорят, что видели ангелов.. с какой стати я должен физикам, которые говорят, доверять больше, чем тем, кто тоже говорят?

  • Ответить
    Альтер Эго

    Ангелы, конечно, есть. Правильно вам говорят. Вселенная конечна. Как в пространстве, так и во времени. Ей примерно 7 500 лет и конец Вселенной тоже не очень далек.

  • Ответить

    > Конец у Вселенной уже обнаружен физеками не, извините, но это бред.. полнейший.. почище ангелов.. ангелы хоть логически обоснованы.. расскажите уже же ж, что это за конец, как он выглядит? кремниевая мембрана? силовое поле? поле чем рождается? вакуум? в этом вакууме рождаются частицы и античастицы? темная материя? кружево из струн? по мне, так это просто кружево, для распила грантов, не более..

  • Ответить

    vnaz, а как ты себе представляешь, вот пустота — это часть вселенной? Или это отсутсвие всего, в том числе, значит, и вселенной? Вот представь: летишь ты очень быстро, обгоняешь разлетающиеся галактики. Вот, пролетел мимо последнего атома водорода, и дальше летишь уже в кромешной пустоте. Час летишь, два летишь, а вокруг — ни-че-го. Пустота.

  • Ответить

    >расскажите уже же ж, что это за конец, как он выглядит? конец никак не выглядит, там просто кончается пространство-время — если вы вдруг окажетесь рядом и полетите в сторону конца, то самим своим присутствием создадите там новое пространство — пространство зависит от наличия гравитации и материальных объектов А. Эйнштейн, когда его однажды попросили кратко изложить суть ОТО, сказал так: «Раньше считали, что если каким-либо чудом все материальные вещи исчезли бы вдруг, то пространство и время остались бы; согласно теории относительности вместе с вещами исчезли бы пространство и время». И вы же в курсе, что вселенная постоянно расширяется и это наблюдаемый научный факт? Галактики «разбегаются» друг от друга со сверхсветовой скоростью — они не перемещаются с такой скоростью, а само пространство расширяется — между галактиками становится больше пространства, это как будто растягивают резиновую пленку

  • Ответить

    > по мне, так это просто кружево, для распила грантов, не более.. Предлагаю людям, не верящим в (астро)физику, немедленно прекратить использовать любые приборы, использующие квантовые и релятивисткие эффекты. Электронику там, космическую технику, современную медицину. > Вот представь: летишь ты очень быстро, обгоняешь разлетающиеся галактики. Вы гуманитарии тут, што ле, все? За концом вселенной ничего нет. Даже вакуума нет. И пространства нет. И попасть туда нельзя. А то, что вы этого себе представить не можете — не аргумент. Ковалентную связь или там туннельный эффект или эффекты СТО тоже сложно себе представить, а они есть и хорошо измеримы и применяются на практике. > Вот, пролетел мимо последнего атома водорода Это не конец вселенной. Конец вселенной — грубо, там, куда долетел самый первый фотон. Но догнать и обогнать его нельзя, потому что он фотон.

  • Ответить

    Достопочтенный Каа! Я могу поставить мысленный эксперимент и представить, что я лечу быстрее скорости света и обгоняю этот самый «самый первый фотон»? Или скорости больше скорости света даже помыслить нельзя? Ну, по крайней мере буквы такие я могу написать: «ле-чу со ско-ро-стью две ско-рос-ти све-та»? Смотрите, написал! Хотя усилие над собой совершать пришлось, да. И у меня ещё один вопрос: вот это, то, что вы обозначили словами «ничего нет, даже вакуума нет» — оно как называется? Могу ли я назвать его «пустотой»? Или, типа, пустоты там тоже нет? В смысле: там ничего нет, даже вакуума нет, и даже «ничего нет, даже вакуума нет» — там тоже нет? _

  • Ответить

    >Или, типа, пустоты там тоже нет? пока там ничего нет, там нет даже пустоты, да что там пустоты — там даже Времени нету :) а если вы там появитесь, то появится и пространство и время и пустота а вообще это, как если бы плоские жители, живя на поверхности сферы, рассуждали бы где край у сферы — хотя их пространство ограничено, в их плоском мире края нет. а ваше предложение полететь быстрее света, аналогично предложению плоским жителям покинуть плоскость — то есть не вписывается в правила игры

  • Ответить

    jet вы понимаете, что это самозамыкание: «ничего нет, там нет даже пустоты»? Это «брадобрей, который бреет всех, кто не бреет себя сам». «Ничего нет» и «пустота» — это ведь тождественные выражения. Когда я говорю, что «я там появлюсь» — я же имею в виду себя не как физический объект, а как «зонд» мыслительного эксперимента. PS. А у сферы края, конечно же, нет. Но она самозамкнута. Да вот мы с вами живём фактически на сфере — на поверхности Земли. _

  • Ответить

    > Когда я говорю, что «я там появлюсь» — я же имею в виду себя не как физический объект, а как «зонд» мыслительного эксперимента. Ну вот, это аналогично предложению плоским жителям покинуть сферу — если мы говорим про плоский сферичный мир, то что вне этого мира? Ничего, но и пустоты там нет — внешний мир «не существует» для плоского сферичного пространства. Так и вы предлагаете попасть в место, которого просто нет в природе.

  • Ответить

    нет, подождите, сфера самозамкнута (я это выше вписал, повторю здесь). А Всленнная, вроде, нет. И вот этот упомянутый выше «самый первый фотон» — знай себе летит и летит (по прямой, кстати, летит, правда?) и никаких проблем не знает. Вот я вполне могу представить, что я сижу на этом самом «самом первом фотоне» — этакий Колумб-первооткрыватель пустых (доселе) пространств.

  • Ответить

    господа интеллектуалы!.. Вы не поняли вопроса (что, по большому счету, не удивительно).. Вопрос не в том, что за концом Вселенной — понятно, что там ничего, если он конец.. Вопрос — какой он, этот конец? Сам конец? Что такое «окажетесь рядом»? Насколько рядом? На каком расстоянии от него нужно оказаться, чтобы стать ничем или новым демиургом, если таки оказывается, что за концом я создам отсутствие конца? > Предлагаю людям, не верящим в (астро)физику, немедленно прекратить использовать любые приборы, использующие квантовые и релятивисткие эффекты А я предлагаю Вам или аргументировать Вашу (не Вашу, конечно, а ту, которую Вы всосали, не подумав о степени правдивости) точку зрения, или тогда не рассказывать, что это, мол, факт — ограниченность Вселенной. И так, на всякий случай — квантовые эффекты вполне реальны, хотя бы потому, что они работают, это подтверждено практикой. Подумаешь, нуль-переход. Чего в этом такого невозможного? Вот фотон здесь, а вот он там, мгновенно, так сказать. Это как тангенс в точке

  • Ответить
    Альтер Эго

    Транспонировали не ипподром, инфа 100% И да, таки муж жены далеко не всегда точен в своих формулировках. Промах с конечностью числа урлов особенно досаден. А использование термина «полнота» в условиях бесконечности числа документов довольно противоречиво. Широко используемая в узких кругах трактовка «полнота по документам с оценкой X+» легко приводит к полноте 100% при наличии вконтакта.ру при X = vital.

  • Ответить

    > Вот я вполне могу представить, что я сижу на этом самом «самом первом фотоне» — этакий Колумб-первооткрыватель пустых (доселе) пространств. тогда вселенная для вас станет плоской http://ru.wikipedia.org/wiki/_ — размер вселенной вдоль вашего вектора скорости станет равен нулю

  • Ответить

    тфу, блин.. Редакция :) можно сделать, чтобы комменты при редактировании не теряли введенные раньше букавки? Хотя, мож, они да.. просто переходят в другой информационный континиум? Тогда пусть так, прикольно..

  • Ответить

    vnaz проблема с Вашим вопросом, по-моему, в том, что «Вселенная» это «Всё». И, соответсвенно, языковая конструкция «то, что находится, за пределами Всего» — это снова самозамыкание. Здравствуй, Брадобрей. Либо же нужно говорить, что ничего там нет, за пределами Всего. Nihil. И никакой границы между Всем и Nihil нету. Я же, например, развожу надвое, когда говорю: есть Пустота (Пустое Пространство) и в ней разлетается в разные стороны весь этот космический мусор, возникший в результате Взрыва. Коей мусор в совокупности и есть Вселенная. Но Пустота не является частью Вселенной. PS. Кстати, вопрос «есть ли пустота?» тоже является замозамыканием. Либо же ответ на него: ну конечно её нет, она же Пустота, рафинированное отсутствие чего-либо. _

  • Ответить

    проблемы с моим вопросом нет.. было вброшено, что де количство атомов во Вселенной конечно.. потом было спрошено, кто это придумал.. в ответ был приведен аргумент — ибо известно, что Вселенная конечна. Меня, знаете ли, очень интересуют типы, которым известны такие вещи — откуда им это известно или как хотя бы представляют себе это им известное. Вот и всё.. Ну, или проще: меня не интересует, и я про это не спрашивал — существует или не существует за пределами Всего. Ибо вопрос в существовании этого предела

  • Ответить

    кстати вот что пишут http://ru.wikipedia.org/wiki/Вселенная [QUOTE]Современные космологические модели очень сложны, а иногда используют пока неподтвержденные гипотезы. К примеру, ко Вселенной применяются уравнения ОТО, хотя ОТО — это теория, хорошо подтверждённая только в масштабах Солнечной системы[62][63], и её использование в масштабе галактик и Вселенной в целом может быть подвергнуто сомнению. Космологические модели были бы много проще, если бы протон не был стабильной частицей и распадался бы[64], чего современные эксперименты в физических лабораториях не подтверждают; и этот список можно продолжить. Но на данный момент с таким положением дел приходится мириться, так как лучшего объяснения наблюдательных данных пока не существует.[/QUOTE] [QUOTE]Модель расширяющейся Вселенной описывает сам факт расширения. В общем случае игнорируется, когда и почему Вселенная начала расширяться, то есть теория Большого Взрыва — лишь частный случай модели расширяющейся Вселенной. В основе большинства моделей расширяющейся Вселенной лежит ОТО и её геометрический взгляд на природу гравитации. Изотропно расширяющуюся среду удобно рассматривать в системе координат, расширяющихся вместе с материей. Таким образом, расширение Вселенной формально сводится к изменению масштабного фактора всей координатной сетки, в узлах которой «посажены» галактики. Такую систему координат называют сопутствующей. Начало же отсчёта обычно прикрепляют к наблюдателю. Единой точки зрения, является ли Вселенная действительно бесконечной или конечной в пространстве и объёме, не существует. Тем не менее, наблюдаемая Вселенная, включающая все местоположения, которые могут воздействовать на нас с момента Большого Взрыва, конечна, поскольку конечна скорость света и существовал Большой Взрыв.[/QUOTE]

  • Ответить

    > проблемы с моим вопросом нет.. было вброшено, что де количство атомов во Вселенной конечно На это ответить наверно проще есть так называемое [URL=http://ru.wikipedia.org/wiki/_]Реликтовое излучение[/URL], которое можно реально наблюдать, даже карту составили. Сфера, которая испускает это излучение — это размер и форма вселенной, когда ей было только 400 тысяч лет. Исходя из этого и закона сохранение энергии можно сделать вывод, что кол-во материи и энергии не бесконечно.

  • Ответить

    Вообще-то астрофизики, если хотят оставаться естествоиспытателями, не имеют право говорить про Всё (про Вселенную, понимаемую как Всё). Они могут говорить только про то, что видят в свои телескопы. А про то, что не видят, должны так и говорить: ничего про это не знаем, потому как не можем увидеть в наши телескопы.

  • Ответить

    Ага.. то конец существует, то это теория, но можно считать, что окнец существует, потому что был ББ.. А то, что и про ББ еще неизвестно, был ли он — мы опять мимо прошли..

  • Ответить

    > Они могут говорить только про то, что видят в свои телескопы. теории строятся конечно только на наблюдениях, но хорошая теория всегда должна предсказывать то, чего еще не наблюдали и что со временем можно будет проверить и когда появляются новые данные, всегда проверяют насколько это согласуется с общепринятыми теориями > А то, что и про ББ еще неизвестно, был ли он — мы опять мимо прошли в физике вообще точно ни о чем не известно, есть только теории, которые пока не опровергнуты ;) а есть теории, которыми пользуются, даже после доказательства, что они неверны — например законами Ньютона, потому что они проще и дают достаточную точность в обычной жизни

  • Ответить

    > когда появляются новые данные всегда проверяют насколько это согласуется с общепринятыми теориями вот-вот.. когда появляются новые данные, появляются новые теории.. так появилась теория ББ, теория темной материи, теория струн.. И все — вокруг того, что скорость света — максимально возможная для материи.. Не так давно вся геометрия базировалась на том, что параллельные прямые не пересекаются.. И про конечное число атомов во Вселенной, которое не менялось со времен ББ — напомните-ка мне, кто успел опровергнуть теорию, что в звездах синтезируются атомные ядра?

  • Ответить

    > И про конечное число атомов во Вселенной, которое не менялось со времен ББ — напомните-ка мне, кто успел опровергнуть теорию, что в звездах синтезируются атомные ядра? так не говорят что не менялось, говорят, что кол-во не бесконечно а так да — можно из легких атомов слепить тяжелый или наоборот в ускорителе разбить тяжелый на легкие, закон сохранения энергии при этом не нарушается и до бесконечности атомы не плодятся

  • Ответить

    Кстати, когда говорят о «расширяющейся вселенной», имеют в виду, насколько я понимаю, разлёт вполне себе макро-объектов — типа звёзд и галактик, которые явно движутся не со скоростью света. При этом все эти звёзды, как известно, светят во все стороны, испускают фотоны. Которые как раз разлетаются со скоростью света. Поэтому объём пространства (или, скажем, его «диаметр»), в котором присутствуют фотоны, во много-много раз больше, чем объём (диаметр) того пространства, в котором присутствует вещество. Поэтому если считать, что границы Вселенной «раздвигаются» разлетающимися фотонами (типа, прилетел фотон и «создал» пространство и время, гы), то так понимамая Вселенная будет представлять из себя очень маленькое «ядро», в котором присутствует вещество (от атомов до звезд и галактик), а вокруг этого ядра — бескрайние пространства, в которых нет ничегошеньки, кроме ошалело разлетающихся в разные стороны фотонов и прочих не имеющих массы и двигающихся со скоростью света частиц. _

  • Ответить

    > PS. А у сферы края, конечно же, нет. Но она самозамкнута. Да, кстати, первый модели вселенной Эйнштейна такими и были — замкнутыми, если долететь до края, то окажешься с другой стороны вселенной. Но потом эту модель пришлось отбросить из-за открытия, что вселенная расширяется, а потом ему пришлось и Большой взрыв признать.

  • Ответить
    Игорь Ашманов Сам себе компания

    Если верить в Большой взрыв, то бесконечности неоткуда взяться. Взрыв произошёл в точке. Она конечна. Это было конечное время назад. Вселенная расширялась с тех пор с конечной скоростью, не больше скорости света. Следовательно, к настоящему времени Вселенная занимает конечный объём. Не более, чем сфера радиусом, равным возрасту Вселенной, умноженным на скорость света. Даже если пространство расширяется и в середине, это всё равно конечный процесс с конечными скоростями. В конечном объёме может содержаться только конечное число атомов и прочих частиц. Да, числа и расстояния ну очень очень большие, но конечные. Где та дыра, через которую могла бы влезть в наш мир Бесконечность, настоящая, математическая? Её не видно. Увы, всем, кто любит Вечность и Бесконечность, надо верить во что-то другое. Вообще, мне кажется, тут дело в неаккуратном обращении со словами, которые в голове альтереги приобретают смещённое, приблизительное значение. Наша местная анонимная программистская образованщина просто использует слова и термины приблизительно, не понимая или не помня их настоящего, точного смысла. Хотят сказать «урлов много, и они всё время появляются новые» или «Вселенная очень большая и всё время расширяется», а говорят — «бесконечность»… Хотят обсуждать качество поиска, используют неправильно понимаемый термин «полнота», иногда прямо в его дуальной противоположности, обсуждая на самом деле точность и релевантность.

  • Ответить
    Альтер Эго

    > Наша местная анонимная программистская образованщина просто использует слова и термины приблизительно, не понимая или не помня их настоящего, точного смысла. Дв, да. И только умные и образованые ашмановы пишут совершенно точно «Поисковик проблема полноты не волнует вообще (всё равно пользователю будет сообщено, что найдено стопиццот миллионов страниц)». Такая точность и глубина мысли! Куда там альтерэгам :)

  • Ответить
    Альтер Эго

    > Если верить в Большой взрыв, то бесконечности неоткуда взяться. > Взрыв произошёл в точке. Она конечна. Вот что происходит если в предмете не разбираться. Прходится вспоминать про Большой взрыв и предлагать верить в него. А достаточно было сказать, что на практике длина урлов, которые понимают браузеры, вообще-то конечна (привет, IE8 с его 2083 символами) и набор символов, который урл может содержать — тоже.

  • Ответить

    Если верить в Большой взрыв, то бесконечности неоткуда взяться. Клёвый объект для веры кто-то себе выбрал :-) когда появляются новые данные — появляются новые теории.. так появилась теория ББ, теория темной материи, теория струн.. Не, вы не пошутили? Струнная теория появилась, когда появились новые данные? Комильфо. А тогда M-теория появилась из каких новых данных? ;-) А что такое теория тёмной материи и ББ, наверное, спрашивать не этично?

  • Ответить
    Игорь Ашманов Сам себе компания

    Классная у вас игра — в каждом сообщении сообщить мне, что я хоть в чём-нибудь не разбираюсь. Что, так сильно колбасит самолюбие? Огромное вам спасибо про замечания про длину урлов и прочее. Просто открыли глаза. Вот как вы думаете, закончив Мехмат и всю жизнь занимамшись высшей алгеброй и прикладной лингвстикой, то есть полседовательностями букв, я имею какое-то представление о конечности языков из слов конечной длины над конечными алфавитами? Вообще бесконечность — это такая большая штука, настолько принципиально отличающаяся от всего нам известного, что доказывать её отсутствие, то есть конечность, можно как угодно: — всё, что может сделать человечество — конечно, — все, что помещается в конечную память наших конечных компьютеров — конечно, — всё, что может быть изображено за конечное время конечным числом электронов — конечно, и так далее. При этом транспонированным гуингмам не запрещается ржать. При этом по сравнению с бесконечностью всё конечное одинаково ничтожно, как бы оно не различалось между собой в своей конечности на миллиарды порядков. Есть, однако, мнение (имеющее прямое отношение к обсуждаемым проблемам ИИ), что одновременно с мириадами конечных вещей и сущностей вокруг и внутри нас существует множество бесконечных сущностей. А именно, в человеке всё конечно, кроме души. А душа — бесконечна, то есть имеет равный масштаб с Вечностью и прочими бесконечностями. Возможно, там есть ещё и разные мощности бесконечностей, но это в нашем случае неважно. Поэтому существенные вещи, происходящие с душой, не ничтожны относительно бесконечности, а очень важны. Скажем, выйти на IPO или заиндексировать много урлов — конечный поступок, в вечности совершенно неважный, а соврать своему ребёнку или дать денег на операцию чужому ребёнку — поступки, в общем, бесконечные. Если задаться целью регулярно классифицировать поступки на конечные и бесконечные, можно приобрести очень свежий и содержательный (хотя и не новый) взгляд на мир.

  • Ответить

    всё таки лучше первоисточники читать, а не Дискавери смотреть. взрыв, который произошел одновременно везде, заполнив с самого начала всё пространство, причем каждая частица материи устремилась прочь от любой другой частицы. В этом контексте «всё пространство» может означать либо всё пространство бесконечной Вселенной, либо всё пространство конечной Вселенной, которое замкнуто на себя, как поверхность сферы приписывается Стивену Вайнбергу Т.е. нобелевские лауреаты не знают.. и не задумываются, кто поумнее — конечна она или бесконечна.. Но настоящие программисты зато _точно_знают_ (ТМ), ага, что внутри она обязательно золотая конечная.. А что такое теория тёмной материи и ББ, наверное, спрашивать не этично? Могли бы и сами найти, но я Вас направлю: http://ru.wikipedia.org/wiki/_ http://lurkmore.to/ http://ru.wikipedia.org/wiki/_

  • Ответить

    > А именно, в человеке всё конечно, кроме души. А душа — бесконечна Если Душа — физическое явление, просто еше не изученное, то почему она бесконечна, и не дублирует ли она функции нейронных связей, число коих конечно? Или это явление так сказать мистического характера или божественного или филоcофская категория? > Если верить в Большой взрыв, то бесконечности неоткуда взяться. > Взрыв произошёл в точке. Она конечна. Насколько я понимаю, не совсем верно. Не взрыв произошел в точке, а пространство было точкой и начало с ускорением расширятся. Мы можем наблюдать вселенную только внутри собственного горизонта событий, но считается что из любой точки вселенной наблюдатель увидит примерно тоже самое — «сферу» из разбегающихся во все стороны галактик. То есть Вселенная бесконечна, при этом она конечно может иметь конечный объем. А может и не иметь.

  • Ответить
    Альтер Эго

    > Вот как вы думаете, закончив Мехмат и всю жизнь занимамшись высшей алгеброй и прикладной лингвстикой, то есть полседовательностями букв, я имею какое-то представление о конечности языков из слов конечной длины над конечными алфавитами? Спасибо, что упомянули про мехмат, а то как-то из топика не было очевидно, что вы его закончили. Вы почему-то обратились к вопросу веры в боьшой взрыв, а не конечности языков из слов конечной длины над конечными алфавитами.

  • Ответить
    Альтер Эго

    > в человеке всё конечно, кроме души. А душа — бесконечна, то есть имеет равный масштаб с Вечностью и прочими бесконечностями. OMG. Евангелие от Ашманова. Остапа понесло.

  • Ответить

    O_o, а вы уверены, что вы понимаете смысл утверждения «пространство было точкой»? Вот, мне, в силу моей ограниченности, кажется, что пространство это есть отношение между объектами. То, что любые два объекта А и Б находятся в отношении «расстояние от А до Б равно Х» — вот это и есть пространство. Поэтому когда я читаю (jet 11.03.2012 21:28:41): «… конец никак не выглядит, там просто кончается пространство-время — если вы вдруг окажетесь рядом и полетите в сторону конца, то самим своим присутствием создадите там новое пространство …» — то мне это не понятно. Что, один фотон прилетел в точку Х1 и «самим своим присутствием создал там новое пространство», а другой фотон прилетел в точку Х2 и «самим своим присутствием создал там новое пространство», и вот расстояние между этими фотонами 100500 световых лет, и «там» и «там» пространство есть, а вот точнёхонько посередине между ними, где никаких фотонов нет и не предвидится, — там пространства нет?

  • Ответить

    Как-то мимо кассы вы меня направили? ;) типа шутите? Панимаю! А для тех, кто не в ладах с тонким хьюмором я нашу: Никакой теории тёмной материи нет, равно как и теории космологической постоянной и теории тёмной энергии. Смекаете? Я без ссылок, извините, простака. И простите за бестакность, я не предполагал, что образованные умы нынче путают букву Б и В. Буду знать, спасибо за науку.

  • Ответить
    Игорь Ашманов Сам себе компания

    OMG. Евангелие от Ашманова. Я не ваш God. И мне нечего вам сообщить, у меня нет для вас благой вести. Есть только плохие новости: у тебя все плохо, чувак, ты анонимный, недалекий, злой и самонадеянный. Это катастрофа. Вы почему-то обратились к вопросу веры в большой взрыв, а не конечности языков из слов конечной длины над конечными алфавитами. Вы, по-моему, перепутали темы. А я поясню. Потому я обратился к Большому взрыву, что тут про него ВНЕЗАПНО начали говорить местные городские сумасшедшие. Которые несколько не вкуривают в разницу между бесконечностью и всем остальным. Отчего же не включиться в дискуссию, если всё равно тут всем делать нечего? А не для того, чтоб доказать, что количество урлов конечно. Это не надо доказывать, это и так очевидно, о чём я сразу этим ржущим гуингмам и написал сильно выше по треду: «Конечно, можно было бы поржать относительно того, что в каждый момент времени на планете конечное число чего угодно, но с лошадями я не ржу, по принципиальным соображениям.» Про бесконечность же ясно только одно: при столкновении с нею все наши мерки оказываются бесполезными, потому что они одинаково ничтожны. Поэтому в реальном, физическом мире никакой бесконечности и нет, и увидеть её трудно. Всё вокруг конечное. А где же тут у нас бесконечность? Есть мнение, что бесконечна душа. Тогда понятны проблемы и неочевидность разных заповедей, запретов и разрешений, странности вроде исповеди и прочих таинств — это инструменты для работы с бесконечным. Они не могут быть ни на что похожи, не могут не быть странными и непонятными. Понятно, что они сто лет не нужны тому, кто и не парится этой бесконечностью. Вот вам, например. Для вас и число урлов — уже бесконечно, а полнота индекса — главный жизненный приоритет.

  • Ответить

    > только плохие новости: у тебя все плохо, чувак, ты анонимный, недалекий, злой и самонадеянный ммм.. 2000+ лет известно, что всё это катастрофическая неправда.. он хороший, добрый, хочет, чтобы всё у всех было хорошо.. а гадкие … его хотят втоптать в его же (да и других же) навоз.. разве нет?

  • Ответить

    Игорь Станиславович вы пишите так много букв и с таким выраженным эмоциональным окрасом, что невольно вспоминается слово «сублимация». простите, ничего личного)

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну так если я ни в чём не разбираюсь, не могу писать ничего, кроме чуши, и мне абсолютно нехрена делать, то конечно — сублимация. А вы, кстати, где подхватили этот устоявшийся термин, во фрейдизме?

  • Ответить

    > Ну так если я ни в чём не разбираюсь, не могу писать ничего, кроме чуши, и мне абсолютно нехрена делать, то конечно — сублимация. не могу согласится, одно из другого совершенно не следует) не знаю насчет фрейдизма (он вроде бы считается устаревшим), я в обычном «бытовом» понимании — снятие (не обязательно осознанное) психического напряжения через занятие деятельностью приносящей психологическое или физиологическое удовлетворение

  • Ответить

    > O_o, а вы уверены, что вы понимаете смысл утверждения «пространство было точкой»? а из физиков этого пока никто не понимает, такой объект называется космологической или гравитационной сингулярностью и в нем нарушаются физические законы, которые действуют сейчас http://ru.wikipedia.org/wiki/_ [QUOTE]Например, не могут быть одновременно бесконечными плотность и температура, т. к. при бесконечной плотности мера хаоса стремится к нулю, что не может совмещаться с бесконечной температурой. Проблема существования космологической сингулярности является одной из наиболее серьёзных проблем физической космологии. Дело в том, что никакие наши сведения о том, что произошло после Большого Взрыва, не могут дать нам никакой информации о том, что происходило до этого.[/QUOTE] > Кстати, когда говорят о «расширяющейся вселенной», имеют в виду, насколько я понимаю, разлёт вполне себе макро-объектов — типа звёзд и галактик, которые явно движутся не со скоростью света. не, вселенная расширяется не за счет движения, и пространство расширяется со сверхсветовой скоростью — расстояние между удаленными галактиками увеличивается быстрее скорости света Кстати скорость расширения в данный момент постоянно увеличивается, чтобы объяснить само расширение и ускоренное расширение «придумали» темную материю и темную энергию И если расширение не остановится (точно этого не выяснить, пока не изучат темную энергию), то тогда через какое-то время все галактики и звезды улетят за горизонт событий и космос для нас будет темным и пустым.

  • Ответить

    Это все очень новая наука, только в прошлом году дали нобелевку за новую модель вселенной. http://lenta.ru/articles/2011/10/05/inflatiob/ [QUOTE]Скорее, из полученных ими данных вытекал некий намек на существование темной энергии. Позже результаты Риса, Шмидта и Перлмуттера были подтверждены с гораздо более высокой точностью данными по флуктуациям реликтового микроволнового фонового излучения — излучения, произведенного вскоре после инфляции. В итоге сегодня у специалистов нет никаких сомнений в том, что темная энергия, которая отвечает за ускоренное расширение Вселенной, существует. И открытие темной энергии полностью подтвердило предсказания инфляционной гипотезы.[/QUOTE] [QUOTE]То есть сейчас, после появления работ Риса, Шмидта и Перлмуттера, можно говорить, что инфляционная гипотеза надежно подтверждена экспериментальными данными? Да, одно из предсказаний инфляции было подтверждено. Более того, в 2013 году в январе будут опубликованы результаты эксперимента «Планк», который в 500 раз чувствительней самого лучшего эксперимента, поставленного до сих пор. И после публикации этих результатов можно будет говорить, что инфляционная гипотеза подтверждена, как говорят, на уровне семи или пяти сигма — то есть с вероятностью 99,999999… процента. Теперь надо, чтобы общественное мнение привыкло к тому, что эти доказательства есть. Потому что все, что приходит из космоса, просто так руками не пощупаешь, в отличие от какого-нибудь нового материала типа графена. [/QUOTE]

  • Ответить

    фу, блин.. всё проще всего (а значит, скорее всего, это вернее всего) объясняется тем, что время течет в обратном направлении.. Т.е. Вселенная не расширяется, а схлопывается (эффект Доплера обусловлен разной скоростью сжатия относительно точки наблюдения), черные дыры как бы сосут информацию, но на самом деле выплевывают материю, и прочая фигня, в т.ч. понятно, откуда существуют верные предсказания — потому что это проекция того, что было, а не того, что будет.. Потому и непонятно, че это за ББ: он не был, а будет — этот глобальный гыгец, когда нас всех расплющит в точку (у которой нулевая размерность).. в общем, всё хорошо, кром того, что было бы непонятно, куда души денутся, если бы не было известно, что денутся они туда, куда владелец души захочет.. извините, может, я больше так не буду..

  • Ответить
    Альтер Эго

    > Я не ваш God. Да этого и не предполагалось. «Евангелие от Ашманова» — это как «Евангелие от Матфея» — сборник идей и жизнеописание одного человека, изложеных другим челвоеком своими словами. Интерпретация так сказать > Есть только плохие новости: у тебя все плохо, чувак, ты анонимный, недалекий, злой и самонадеянный. Это катастрофа. Такой стремительный переход на «ты» Кисо обиделось? > Для вас и число урлов — уже бесконечно, а полнота индекса — главный жизненный приоритет. И снова не угадали

  • Ответить
    Альтер Эго

    Ашманову А вы сами верите в Человека? В то что все люди братья? В прогресс? В неуклонное развитие человечества к лучшему? В информационное общество?

  • Ответить

    Так зачем было этот религиозно-мистический стул сюда заносить? На двух стульях сидеть неудобно — вот и получается, что душа бесконечна, но не у альтерэги с маленькой буквы, а у Меня Любимого — с большой.

  • Ответить
    Игорь Ашманов Сам себе компания

    Да этот стул не я занёс. Этот стул, в форме, понятной для программистской души алтерэги — это бесконечность. Его сюда занесли случайно, по дури. По сути вся мистика, вся религия и прочее заключаются в отличии настоящей бесконечности от всего конечного, что составляет нашу жизнь и окружающее. Как только начинаешь воображать себе не «бесконечное количество урлов», а настоящую бесконечность, как меру вещей, хотя бы условно, на время — тут оно всё и возникает. Старательное ржание гуингмов над ухом (служащее им самим для заглушения работы мозга), конечно, отвлекает, но чувство бесконечности — всё равно сильное.

  • Ответить

    >… в отличии настоящей бесконечности от всего конечного, что составляет нашу жизнь и окружающее. До второй половины 20 века натурфилософы считали, что (материальная) Вселенная бесконечна во времени, пространстве и материальном «наполнении». Ок, скажем, не все натурфилософы, а натурфилософы «материалистического направления», потому как натурфилософы религиозного направления были уверены, что это бог однажды заскучал и создал материальный мир, чтобы поразвлечься. И это, вообще говоря, выражение гордыни современных астрофизиков — что они берут на себя смелость по своим наблюдениям видимых им галактик (что-то там у них краснеется) заявлять, что они знают, когда и как всё возникло и когда и как оно исчезнет/погибнет. Говорить, что эти теории прошли проверку временем, — явно рановато, лет так с тысячу можно подождать, торопиться особо некуда. Эти космологические теории и сейчас уже хромают — требуют костылей в виде каких-то непонятных «тёмной материи» и «тёмной энергии».

  • Ответить
    Игорь Ашманов Сам себе компания

    Как это, интересно, может пройти проверку временем за 1000 лет гипотеза о том, что Вселенной 20 миллиардов лет? Заметим, что в вашем личном случае гипотеза о бесконечности души (или хотя бы её существования после смерти) за 1000 лет точно пройдёт проверку.

  • Ответить

    Гипотезы умирают от других гипотез, а не от тепловой смерти вселенной. Да-да, после смерти я (а скорее, всё-таки, вы) стану всеведущ и всемогущ, стану Богом. Я всё пойму и про «тёмную материю», и про «тёмную энергию», и трижды помянутая тепловая смерть Вселенной перестанет меня расстраивать. Вот вы мне скажите, Игорь Станиславович, после смерти мы с вами (а также со всеми этими бездельниками альтерэгами) будем существовать по отдельности или сольёмся воедино? _

  • Ответить

    И это, вообще говоря, выражение гордыни современных астрофизиков — что они берут на себя смелость по своим наблюдениям видимых им галактик (что-то там у них краснеется) заявлять, что они знают, когда и как всё возникло и когда и как оно исчезнет/погибнет Вы не в ту сторону рулите. Очень мало найдётся космологов, которые будут утверждать, что они знают доподлинно как началась Вселенная. Космология — это моделирование, это поиск ответов на вопросы, вызванные данными опыта. Утверждение и знание — немного из другой области ;)

  • Ответить

    ну то есть это не они, а мы — дураки, что используем «колокольный звон», слышимый оттуда, в качестве аргументов в своих дискуссиях?

  • Ответить
    Альтер Эго

    Специалист с тех-образованием принимает существование бесконечности как математического символа, но не задумывается над реализацией и последствиями ее существования. Стоит только задуматься, и логика потихоньку отказывает, так и до религии недалеко. А потому технарь уперто требует: «не сметь рассуждать о бесконечности! (с) пиньон».

  • Ответить

    Альтер, сдаётся мне, что у тебя нет технического образования. Поскольку в технических ВУЗах, насколько мне известно, курс математического анализа обязателен. И там что такое «бесконечность» подробно разъясняется, прежде чем математический символ ввести в оборот. «Задумываться над реализацией бесконечности» — это, конечно, круто. Это о том, как бы нам половчее бесконечность реализовать? Или о том, как господь бог её реализует? «Последствиями ее существования» — ёжкин кот! Бесконечность — это отсутствие конца, это не «существование», а «несуществование».

  • Ответить

    Думаю нужно сообщить куда следует, все комментаторы, рассуждавшие о бесконечности в конце топика, употребляют запрещенные вещества

  • Ответить
    Альтер Эго

    > И там что такое «бесконечность» подробно разъясняется, прежде чем математический символ ввести в оборот. Ну-ну. Если «бесконечностью» назвать мощность множества точек на прямой (отрезке, плоскости итд) — то от такого определения как-то ни жарко, ни холодно. Ведь «точка» — неопределяемое понятие. Сдается мне, что вы не особо посещали матан и даже не заглянули на http://ru.wikipedia.org/wiki/Бесконечность

  • Ответить

    Когда я посещал матан, не то, что википедии — интернета никакого не было. Так что тут я могу смело говорить, что я больше забыл, чем ты знаешь. В матане бесконечность определяется через последовательности, то есть через множество натуральных чисел. «Lim», а под ним «i», стрелочка и восьмёрка на боку — вспоминай, троешник. Да, сейчас ты мне, конечно, заявишь, что-де «натуральное число — неопределяемое понятие». Ну-ну.

  • Ответить

    И тут такой я захожу на вашу тусовку: The path of the righteous man is beset on all sides by the inequities of the selfish and the tyranny of evil men. Blessed is he who, in the name of charity and good will, shepherds the weak through the valley of darkness, for he is truly his brother’s keeper and the finder of lost children. And I will strike down upon thee with great vengeance and furious anger those who would attempt to poison and destroy My brothers. And you will know My name is the Lord when I lay My vengeance upon thee. Выглядело это так: http://www.youtube.com/watch?v=eRVm_TAE24A

  • Ответить
    Альтер Эго

    > Да, сейчас ты мне, конечно, заявишь, что-де «натуральное число — неопределяемое понятие». Ну-ну. Ну почему же? Натуральные числа вполне можно определить через множества. Например, 0 — это мощность пустого множества (хотя 0 к натуральным не относят), 1 — это мощность множества всех подмножеств пустого множества и так далее. Будем дальше писи мерить или вернемся к теме топика?

  • Ответить
    Альтер Эго

    Хотелось бы определить мощность всех подмножеств множества всех множеств, не являющихся собственным подмножеством. Без этого дальнейшая дискуссия будет непротухтивна.

  • Ответить
    Альтер Эго

    Альтерэга, подписавшйся Дирихле, а понятия «множетво» и «мощность» вы через что определять будете?

  • Ответить
    Альтер Эго

    > Хотелось бы определить мощность всех подмножеств множества всех множеств […] Кантор, залогиньтесь! > а понятия «множетво» и «мощность» вы через что определять будете? Проблемы индейцев шерифа не волнуют.

  • Ответить

    Петер Густав Дирихле, что вы, куда уж мне с вами мериться! Я, кстати, правильно понимаю, что «мощность множества» (через которую вы предлагаете определить натуральное число ) — это есть просто число элементов этого множества?

  • Ответить

    И я хочу просто напомнить, что текущий раунд начался с того, что Некто заявил: «Специалист с тех-образованием принимает существование бесконечности как математического символа, но не задумывается над …» А я ему попытался напомнить, что нормальным специалистам с тех-образованием (если, конечно, речь не о техникуме) на первом курсе читают матан, в котором рассказывают очень много нудных вещей про последовательности, верхние и нижние грани, кванторы All и Exist, пределы и «стремление к».

  • Ответить
    Альтер Эго

    Да нет, число — это мощность, а мощность он оставляет без определения. Никакой он не сварщик, просто маску нашел.

  • Ответить
    Альтер Эго

    Ашманов А как поживает суперсекретный проект Яндекса по искусственному интеллекту про который вы рассказывали тут на роеме и про который говорили, что он выведет акции яндекс на уровень 1000 долларов за акцию. Искусственный супер-интеллект от Яндекса будет покруче супер-переводчика Абби!

  • Ответить
    Игорь Ашманов Сам себе компания

    Отлично поживает. Уже вовсю фигачит. Выведет обязательно, ждите. NASDAQ уже выше 3000 вывели, теперь начнёт дорожать бумага Яндекса. Если прямо сейчас не готовы акции Яндекса покупать, передержите пока их в МММ.

  • Ответить
    Альтер Эго

    Супер-интеллект засадили писать новую энциклопедию, которая погубит Википедию как Википедия погубила Британику. Новая энциклопедия будет в духе протухшего проекта компьютерной модели знания человека Cyc, но удачной, гораздо шире и включать знания на русском языке.

  • Ответить
    Альтер Эго

    Википедию такая штука зарулит, это ясно даже дураку. Это совершенно иной принцип создания классификатора, синтез на несколько порядков эффективнее того ручного труда, который организован википедией. У нее просто нет шансов, просто никаких…

  • Ответить
    Игорь Ашманов Сам себе компания

    Кто кого зарулит, ещё бабушка надвое прогностировала: http://www.vz.ru/economy/2012/3/15/568514.html Прямые ответы Google готовит революцию в поисковике 15 марта 2012, 13::30 Фото: ИТАР-ТАСС Текст: Полина Спелова Интернет-гигант Google намерен существенно модернизировать проверенную временем систему поиска. Как утверждают разработчики, изменения поисковой политики, которые являются самыми значительными за всю историю компании, могут затронуть миллионы веб-сайтов. В течение следующих нескольких месяцев пользователи Google могут наблюдать, как изменяется выдача результатов поиска. Юзеры получат не только список традиционно синих ссылок, которые ведут на сайты, но также и другую информацию, дающую прямые ответы на запрос, которая будет располагаться в верхней части страницы. Изменения выдачи результатов поиска являются крупнейшими в истории компании и могут затронуть миллионы веб-сайтов, а также компании, которые занимаются продвижением сайтов и опираются на существующие технологии. В то же время нововведения дадут больше рекламных возможностей для Google. Компания стремится обеспечить более релевантные результаты, включив технологии под названием «семантический поиск», который относится к процессу понимания фактических значений слов. Глава поискового направления Google Амит Сингал, который занимается поиском на протяжении 20 лет, объяснил, что новый алгоритм поиска обеспечит лучшее соответствие запросов с базой данных компании. Семантический поиск может помочь ассоциировать разные слова друг с другом. К примеру, поиск по слову Google выдаст не только сведения о компании, но и имена ее учредителей – Ларри Пейджа и Сергея Брина, пишет TheWall Street Journal. К примеру, если мы сейчас задаем поиск по слову «Озеро Селигер», то получаем просто ссылки сайтов, которые содержат это словосочетание. Первой выпадет ссылка на сайт электронной энциклопедии Wikipedia.com, который будет содержать наиболее полную информацию об озере. Новый алгоритм Google позволит выдавать не только ссылки на сайты, но и имеющиеся данные об озере – месторасположение, глубину, среднюю температуру, исторические факты, имена, достопримечательности, информацию о близлежащих отелях и так далее. На более сложный вопрос, например: «Какие 10 самых крупных озер в Калифорнии?» – Google сам сможет дать ответ, а не только выдать ссылки на другие сайты. Суть сводится к тому, что существующие технологии опираются только на поиск по ключевому слову, а алгоритм Google будет ранжировать веб-страницы по смыслу, степени ценности и полноты информации по заданному запросу. Это будет достигнуто путем изучения веб-страниц, а не путем поиска ключевых слов на странице. Отметим, что сейчас SEO-менеджеры оптимизируют страницы сайтов для поисков именно по ключевому слову. Принято, что ключевое слово и словосочетание должно занимать до 5–7% контента продвигаемой страницы. Это является маркером, по которому поисковики выдают ссылку на сайт и выдвигают его в топ. Если Google поменяет концепцию, то SEO-менеджеры будут искать новые технологии, как обмануть поисковик. Если сейчас достаточно написать несвязный текст и наполнить его ключевыми словами, то в будущем такое не пройдет. Кстати, 5–7% взялись неспроста. Дело в том, что если ключевое слово будет встречаться чаще, то поисковик не будет учитывать эту страницу, поскольку он определит ее как специально написанную для поисковика, а не для пользователя. Предстоящие изменения имеют серьезные последствия для Google, который доминирует на рынке поиска в Интернете – на него приходится около 66% доли на мировом рынке и более 75% всех доходов поисковиков от рекламы. К примеру, контекстная реклама, которая появляется справа от результатов выдачи, приносит Google 37 млрд долларов в год. Как объяснил Сингал, открытию новой страницы в истории поиска предшествовала многолетняя и напряженная работа Google. Так, в 2010 году компания Google приобрела корпорацию Metaweb Technologies, которая разработала и поддерживала семантическую базу данных Freebase. На момент приобретения база данных Freebase насчитывала 12 млн записей различной тематики, включая литературу, музыку, кино, знаменитых людей, компании и даже географические достопримечательности. Для сравнения: в Wikipedia есть 3,5 млн английских записей. Как сообщил Сингал, 50 инженеров из Google и команды Metaweb смогли расширить количество записей до 200 млн. Это удалось сделать за счет применения новых алгоритмов поиска, которые позволяли собрать разрозненную информацию по глобальной Сети. Также велась работа с организациями и правительственными учреждениями с целью получения доступа к базам данных, в том числе с World Factbook, которая собирает современные энциклопедические сведения о странах мира.

  • Ответить
    Альтер Эго

    Грубо говоря, гугл натягает инфромацию с других сайтов, разных авторов и будет выдавать её за свою? Молодцы! :)

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну и немножко, напрягает, конечно «эффект Компрено». А именно пиар до релиза, с разговорами, что всё круто и, делали много лет и в базе мульёны всего.

  • Ответить
    Игорь Ашманов Сам себе компания

    А учить подписчиков Роема хорошему тону — это теперь хорошая идея? Вообще из нескольких статей про это на Взгляде была самая полная, с цифрами.

  • Ответить
    Альтер Эго

    Предполагаю, что их быстро отшлёпают если они указывать источники не будут(делиться трафиком).

  • Ответить
    Альтер Эго

    Эта ваша цезурити, кстати, странная какая-то. Звонил, попросили резюме, отправил — молчат уже неделю. На повторные письма не отвечают. Послать духу не хватает чтоли? Кстати, может кому удалённый linux админ нужен, или в офис, в питере. Опыт 10 лет, десятки серверов админю без жалоб от клиентов, высокие нагрузки. (без вредных привычек, интим не предлагать)

  • Ответить
    Игорь Ашманов Сам себе компания

    Она не моя, так что не знаю. Могло не понравиться обсуждение здесь. Могли уже найти кого-то. Сейчас админа, кстати, без интима никто не нанимает.

  • Ответить
    Альтер Эго

    >Сейчас админа, кстати, без интима никто не нанимает. ух ты, а вы каких админов предпочитаете — пухленьких и молоденьких? или небритых и с пивным брюшком?

  • Ответить
    Альтер Эго

    Кстати, можно было бы гармонично пополнить роем разделом «жобс» для обеих сторон баррикады. Странно, что до сих пор раздела нет.

  • Ответить
    Альтер Эго

    Да этих стартапов развелось, все и не упомнишь. По ним серьёзные люди не ходят, одни студенты и HRюшки, другое дело роем!

  • Ответить
    Альтер Эго

    Ашманов Еще как зарулит, вики тупо ляжет под гугл и станет очень неплохим «асессором» для большой энциклопедии. http://habrahabr.ru/post/84583/ Интересна сама методика построения классификатора. Есть кое какие идеи, но боюсь вы не догоните. Хотя если желающие здесь найдутся и смогут поддержать грамотно дискуссию, я могу и здесь выложить свои соображения по этому поводу, но боюсь, что все кончиться как обычно…:) Что касается ИИ на базе поисковика, то идея эта сама просилась наружу еще несколько лет назад и была мной опубликована с последующими потешными коментами в мой адрес. С принципами построения классификаторов боюсь будет также.

  • Ответить
    Альтер Эго

    чтобы дать релевантный ответ на вопрос (взяв его из Энциклопедии и проведя корреляцию с контентом страницы выдать более схожую), нужно еще знать, что в энциклопедии нет ошибок. Энциклопедия должна стать эталоном знаний, а значит, у нее должна быть очень четкая структура классификатора. И для этой цели не подходит частотный принцип, который используется в яндексе. У гугла в этом смысле шансов больше. У него изначально был не частотный, а видовый классификатор (он отлично интегрируется с вики). Вопрос кто кого обгонит исключительно в том, какой тип построения видового классификатора выберет гугл и яндекс…И вот на это можно сделать ставку, а можно посоветовать правильное решение и повысить профит от инвистиций, правда Игорь? :) Но поскольку вы вряд ли сможете сыграть в эту игру, постойте в сторонке и попытайтесь сделать собственные выводы (это я на случай, если дискуссия все таки будет).

  • Ответить
    Альтер Эго

    > профит от инвистиций … > Но поскольку вы вряд ли сможете И снова здравствуйте, очередная пиццод первая инкарнация tar729

  • Ответить
    Альтер Эго

    «Robindranat-Kagor, не держите в себе, расскажите о ваших идеях, давайте, интересно же.» сначала я должен увидеть свой профит, а потом уже… Увы, наличие вашего интереса недостаточно, у меня тоже есть информационные интенты, которые я желаю удовлетворить. «А в том, что граф — не плоский, а многомерный.» угу. Мои попытки запихнуть все это в 3D потерпели фиаско. «Это как учить компьютер водить машину через описание всех возможных ситуаций на дороге — возможных вариантов бесконечное множество.» Вот поэтому безопасность на дороге гарантирует не изучение ситуаций, а ПРАВИЛА, которые все соблюдают. Также и с классификатором. Необходимы ПРАВИЛА его построения, такие же, какие использовались при создании всего того, что нас окружает. От этого надо плясать. «Можно ли вообще осознать объект, используя его самого в качестве инструмента осознания — большой вопрос.» нельзя. Но есть решение — клон, который следует изучать, и зная, что это полный клон, отождествлять найденное с собой. Собственно, так и получается из объекта субъект программно теоретически. Т.е. это когда объект классификации осознает (классифицирует самого себя со свойством «контролирует все»). Дальше идет безусловное прерывание и ожидание разрешения выполнять команды. Эту ситуацию разруливает клон. Ида. БВ это не то, что многие думают. ммм это примерно вот что: Когда вы включаете комп, в котором еще винда не загружена, то где были все объекты рабочего стола (материя как бы и само пространство стола)? Тут также, мир не взрывался а был тупо включен.

  • Ответить
    Альтер Эго

    «что нас окружает. От этого надо плясать.» это очень простые правила-двоичные. надо просто генерить структуру по этому правилу и искать что подходит из того, что есть в базе, а затем складывать в соответствующее подготовленное место. Ошибка существующей методы гугла и вероятно яндекса в том, что делают с точностью до наоборот. строят классификатор не с того конца. тут у кого-то проскакивала здравая мысль по этому поводу. искать лень. И хотелось бы обратиться к модераторам. Мое присутствие на роеме вас сильно напрягает? Гении заставляют людей смеяться, а дураки — оплакивать себя. Это я к тому, что кто-то почитав этот топик будет плакать, вложив бабки не туда, куда надо… вместе с дураками, которые меня банят :)

  • Ответить
    Альтер Эго

    вы его не заслуживаете. вам следует показывать только диафильмы. PS а вы сомневались, что я это я, во всех своих ипостасях в этом топике? Концентрация придурков на роеме конечно меньше, чем в каком-то другом месте, но именно они пролезли в модераторы :) Так всегда бывает, потому что умные не модерируют форумы, они ими владеют и только. Вообще, модератор-звучит унизительно я считаю, особенно на форуме, где блещут интеллектом его участники. Блеать :) По поводу конечностей и бесконечностей. Если отбросить расчлененку, то бесконечностей в принципе быть не может (это противоречит логике), может быть только ее иллюзия, когда система не обладая достаточной полнотой делает вывод о ее существовании, как таракан на колесе. Для него дорога бесконечна, потому что является циклом. Вопрос с другими бесконечностями ничем принципиально не отличается. А вообще, топик удался да…много увидел умных мыслей, не буду тыкать пальцем. спасибо.

  • Ответить
    Альтер Эго

    при построении классификатора-эталона, логично руководствоваться не тем, что есть, а как ДОЛЖНО быть, в этом случае все правильное из того что есть, упорядочится в нужной структуре, а частности окажутся вокруг этого каркаса. Попытка построить все целиком, опираясь на поиск разрозненных данных-тупиковый и неэффективный путь. Неужели эту простую истину так сложно понять?

  • Ответить
    Игорь Ашманов Сам себе компания

    Да, сложно понять. Мы же тупые здесь. То есть мы бы хотели вложить своих лишних-прелишних денег во что-то такое крутое, ну вот как следующий Гугол. Но тупые и увидеть этого нового не можем. а вот у меня тупой вопрос: вот тар(двадцать девять в квадрате) бегает по весям родного Рунета со всеми этими россказнями так долго, что у нас уже выросли дети. А что ж у него нет своего крутого проекта? Который ну ваще, не просто караул, ну крутизна, круче всяких тупых Абби и Яндексов?

  • Ответить
    Альтер Эго

    «Да, сложно понять. Мы же тупые здесь.» Не надо лукавить, дорогой Игорь Станиславович (заметьте, я отношусь к вам уважительно, а мог бы и покреативить над вашими инициалами), ведь вы не разговариваете на роеме с теми, кто вам не интересен и от кого не ждете ценной для себя инфы, а посему поимейте уважение и называйте меня либо Тарасов, либо по нику tar729 (это девять в кубе, кстати, пора прекратить уже плоско шутить, объемнее надо быть, объемнее). Ваша тактика здесь предельно понятна. Вы отнюдь не мазохист чтобы вам нравилось, когда вас тыкают носом в вашу некомпетентность. Вы имеете сатисфакцию от того, что при всем прочем, получаете слишком ДЕШЕВО то, что вам нужно, -знания в предметной области, которые другим достаются очень не просто, поверьте. Вся ваша тут тирада с Абби, прагами и пр. тому в доказательство. Надеюсь, вы обновили свои знания. Так что не надо тут эпидерсию разводить, ладно? Потрудитесь запомнить как меня зовут, а то я при случае не смогу воспользоваться профитом от того, что общаюсь с Вашей Величествой. Ну а как же иначе, дорогой мой? :) У всего есть своя цена. Ты мне я тебе и все довольны. А если вам нужно что-то более ценное, то вам сюда http://yasha-god-of-the-internet.naro…tvovaniya/ для проявления начальной лояльности. ДАЙ ДЕНЕГ ГАТ! :) Блин щас уписаюсь от смеха просто… И еще запомните вот что: чем громче имя, тем опаснее глупость, которая от него исходит. Так вот это про вас и про ваши тут потуги обсуждать некоторые вещи. Это инсайдерский форум и вам прекрасно известно, какую роль инсайд играет в принятии тех или иных решений в крупном бизнесе. И уж коль вы позиционируете себя тут так, ощущайте хоть немного ответственность, которая на вас ложится (подчеркну: не вы на ответственность ложитесь, а она на вас). «бегает по весям родного Рунета со всеми этими россказнями так долго, что у нас уже выросли дети.» Как смешно. У самого дети выросли. А бегаю я по своим делам, не чета вашим, конечно уж куды нам, но худо бедно вызываем иногдЫ интерес к себе. «А что ж у него нет своего крутого проекта?» У меня есть свои проекты достойные моих знаний, умений и финансов, и все они не старше полутора лет, а некоторые так вообще только стартанули. Если у вас дети так быстро растут, то я рад за вас. И вообще, не вам судить о крутости моих проектов. Вы и половины их алгоритмов не осилите.

  • Ответить
    Альтер Эго

    Не не, от эрр.. (пардон, реакции) Ашманова зависить. Он же у нас анализаторами заведует. Пущай уже анализатор сезонов делает, а чо. Классная идея между прочим, погоду каждый дурак предсказывать умеет, а вот весну…Вот пущай собирает по инету всякие обострения шизофреников (у него же на почту сигналы валятся сами, прям заспамили бедного стартапами по его же словам) Так чего проще, измеряй количество в день и в график выводи :) Все же есть уже. Это у нас с вами, убогих, сигналов и нужных метрик нету, а у великих их пруд пруди и на халяву…:)

  • Ответить
    Альтер Эго

    шутки шутками, а блин это реально ценная мысль, собирать тренды интентов по выборке юзеров, имеющих те или иные ярко выраженные наклонности. Они ведь действительно на некоторые сигналы реагируют первыми, не обязательно весенними. Это может быть полезно в финансовой сфере и иметь корреляцию с определенными типами акций…Ашманов, записывай е-мае, записывай, а то запомнишь… :) Блин, да я тебе тут уже отгрузил идей на полляма. Срочно в церковь! СРОЧНО!!! Пацталом…

  • Ответить
    Альтер Эго

    А такая всеобщая энциклопедия или как можно теперь «онтология» может улучшить поиск? Допустим у них есть идеальные знания «Ашманов» «продал» «тезаурус» «Микрософт» «занимается» «искусственным интеллектом» и «пишет» на «роем ру» итд разве это улучшит поиск Ведь большинство запросов это «одноклассники» «вконтакте» «погода москва» и никому серьезный поиск не нужен.

  • Ответить
    Альтер Эго

    у них есть идеальные знания «Ашманов»… «занимается» «искусственным интеллектом» алярма! ошибка. Ашманов занимается херней, а не искусственным интеллектом. Конечно подобные вещи могут улучшить поиск, но это не базовая его часть, а коррекция, которую еще нужно уметь правильно применить. Базис как раз это эталонный классификатор понятийной базы, энциклопедия знаний. Четкий видовый или частотный классификатор понятий. 1) частотный-Яндекс 2) видовый-Гугл 3) смешаный Интересно, что в природе все это уже реализовано. 1) Ярко выраженным частотным классификатором своей понятийной базы (70/30 примерно)-это так называемые обладатели математического склада ума, им присущи из-за этого свои преимущества и недостатки: а) быстрый поиск шаблонных решений б) медленный поиск нестандартных решений 2) Ярко выраженныйм видовым классификатором понятийной базы (70/30 спримерно) — это так называемые гуманитарии, им присущи противоположные свойства: а) медленный поиск шаблонных решений б) быстрый поиск не стандартных решений Но чаще всего в обычном ЕИ сочетаются оба вида классификатора в равных долях. Итог-среднестатистический планктон, не способный на подвиги. Некая средняя биомасса, так называемое «общество». Люди с ярко выраженными структурами обоих типов-шизофреники, потому что каждое ядро классификатора порождает в своей эволюции субъект, в итоге раздвоение личности, одна из которых математик, а другая гуманитарий. Эти люди крайне производительны и талантливы, они представляют собой огромный интерес у работодателей (по слухам, майкрософт специально отбирает себе в штат шизофреников-программистов), хотя они и сложно управляемы. Шизофреников этого типа подавляющее большинство. Но случаются уникальные случаи, когда личность растраивается и даже расчетверяется, но это крайне редкие случаи, и люди с такими недугами больше похожи на овощи. Люди с ярко выраженным определенным типом классификатора обычно ассоциальны, яркий пример тому ваш покорный слуга, обладающий ярко выраженным видовым классификатором, насколько я могу судить, примерно в соотношении с частотным 95/5. Ассоциальность проявляется в генерации идей и неуемной тяге донести их до общественности при помощи своего тезауруса, который никому не понятен. :). У математиков крайность, мешающая им жить проявляется в замкнутости, аутичности, либо во вспыльчивости, крайней степени упертости. Построение классификатора смешанного типа, который в итоге получится у обоих ПС, достаточно очевидна, учитывая методики, которыми пытаются их создать сегодня. Фишка в том, что эволюция на каждом этапе более благосклонна развитию какого-то одного типа классификатора понятийной базы у ЕИ, который приносит максимум роста для цивилизации в свои исторические моменты. Затем идет спад и генетически активируются другой тип классификатора, который потом преобладает у большинства. С этими вещами связаны соответствующие всплески в культурной революции, техногенными и пр. всплесками результативности развития общества в разных направлениях. Во времена Платона преобладали к примеру люди с гуманитарным типом мышления. 18-19 век, был веком физиков. 20-й математиков. Сейчас идет эпоха шизофреников, рост этого «недуга» просто колоссален за последние 50 лет и вызывает серьезные опасения. Чтобы быть первым для ПС, нужно выстрелить своим и каким то одним типом классификатора (так гораздо эффективнее), а не жевать сопли строя смешанный, криво и долго. Удачный выстрел способен буквально в короткое время оставить конкурентов шибко далеко позади, создав на основе грамотно сделанного классификатора ИИ первым. Тут фишка именно в правильном способе составления классификатора. В правильной организации его саморазвивающейся структуры. Лично я имею представление как это сделать, предложив некий алгоритм создания подобной структуры. Одновременно с этим, я осознаю, что никто не будет воспринимать всерьез те идеи, которые у меня имеются. Т.е. я заранее знаю, что тем, кто принимает подобные решения не понравится то, что я скажу и они не увидят в этом того зерна, который вижу я. Т.е. я не смогу никак монетизировать эти знания напрямую, НО, все же есть способ получить профит от них иначе…

  • Ответить
    Игорь Ашманов Сам себе компания

    Вот Гугл вводит фактографический поиск именно по таким фактам. Они рассчитывают покрыть «семантическими» ответами от 10% до 20% запросов. Но «серьёзный поиск» нужен Тару-Семьсотдвадцатьдевятому, чтобы говорить о нём и восхищаться собою. У него же уникальная ситуация: в голову каждый день прёт множество идей, и каждая — гениальная или просто великая. Вот у вас наверняка не так.

  • Ответить
    Альтер Эго

    Да, знаю, сервисы «ответы» гугл, мэйл, все это из этой серии. Правильный путь, по сути, та же вики, но организованная иначе. «Вот у вас наверняка не так.» почему-же? Часто именно так. Но я привык относиться к этому спокойно. PS Я вижу вы уже запомнили как следует меня называть. Но напрасно вы не пишете мой ник правильно…нехорошосс, но я исправлю, не переживайте: «Но «серьёзный поиск» нужен Тару-Семьсотдвадцатьдевятому» «Тару-Семьсотдвадцатьдевятому»=tar729, Ашманов. Надеюсь, вы поняли что я только что сделал и зачем. Некрасиво себя ведете крутой И.С. Ашманов, сокращенно кИСА. Платите по счетам хоть в этом…для ПС.

  • Ответить
    Альтер Эго

    Если глянуть на спектр запросов, то видно, что там куча запросов фактов и знания позволят поисковикам отвечать на такие запросы не отпуская их со своей поисковой страницы, а значит вбивая в головы людей больше рекламы. Все колдунщики от словаря до погоды «погода Москва» это фактографические запросы. На запрос «погода Москва» они дают вам структурированные факты «сегодня -5, завтра -3 снег». Только сейчас эти колдунщики прописываются в ручную, сидят человечески и пишут код «погода Москва» «погода Москвы» «погода в Москве» возьми данные их такой базы и кидани их в выдачу. А с базой знаний такие вопросы будут отвечатся вручную, появится неограниченное количество колдунщиков, которую будут сконструированны системой, а не прописаны вручную кодерами.

  • Ответить
    Альтер Эго

    естественный. хотя, для Бога он искусственный, конечно. Все же движется по лыжне и с нее не свернуть. Мы создадим свой ИИ, будем для него богами, а мирок, в котором будут плодиться и жить эти ИИ пачками-интернет, станет отдельным миром, жители которого забудут, кто они такие, как появились и точно также будут называть себя ЕИ и верить в нас, ну и так далее. Алгоритмы ранжирования ПС для них примут вид «физических законов» их мира. Все это очень не смешно http://clubs.ya.ru/4611686018427444576/posts.xml?tag=35979371

  • Ответить
    Игорь Ашманов Сам себе компания

    Я вижу вы уже запомнили как следует меня называть. Но напрасно вы не пишете мой ник Я вижу, вы уже перестали запираться и скрывать свою истинную личность. А ведь сотню каментов назад скрывались. Использовали два аккаунта, делали вид, что это не вы. Осталось начать ставить запятые на границах синтагм и в деепричастных оборотах, и вы красиво и спокойно доплывёте до момента очередного бана модератором.

  • Ответить
    Альтер Эго

    Ну, яндекс может использовать другой тезаурус, только и всего. вот тут гораздо интереснее http://clubs.ya.ru/461168601842744457…em_no=5149 и это работает, заметьте. «Использовали два аккаунта, делали вид, что это не вы.» 4 просто новичкам нельзя писать больше 3-х коментов в день. пришлось клонить. Сейчас необходимости в клонах нет. «Я вижу, вы уже перестали запираться и скрывать свою истинную личность» Вообще-то я публичный человек, как и вы. Скрывать мою личность имеют привычку модераторы, размазывая ее по сотням разных аккаунтов и провоцируя клонирование. Я стремлюсь к обратному. У меня есть основной ник tar729 и он меня устраивает.

  • Ответить
    Игорь Ашманов Сам себе компания

    Скрывать мою личность имеют привычку модераторы, размазывая ее по сотням разных аккаунтов и провоцируя клонирование. Какие благостные эвфемизмы! Не проще ли написать: меня забанили в сотнях мест, сотни модераторов, а я всё не унимаюсь?

  • Ответить
    Альтер Эго

    Если ты говоришь на языке, не понятном никому, кроме тебя самого, и (sic!) никто даже не задаёт тебе наводящих вопросов, значит ты говоришь сам с собой. Здравствуй, шизофрения.

  • Ответить

    лан, лан, давайте уже создадим не то, чтобы ИИ, но искуственную модель знаний.. бесконечности в ней не будет, канеш, но вовсе не потому, что ее не существует.. перефразируя известную цитату про суслика — если вы не можете осмыслить бесконечность, это не значит, что она невозможна.. но наша модель вполне приземленная и конечная: онтология — описание сущностей и их связей.. к связям вернемся.. положение — это соотношение сущностей в пространстве (ага, трехмерном таки).. качества — свойства, признаки сущностей.. процессы — изменения качеств либо положения сущности в разрезе времени.. так вот связи сущностей могут описывать те процессы, в которых сущности играют или могут играть ту или иную роль по отношению друг к другу.. т.е. те самые факты.. чего не хватает?

  • Ответить
    Альтер Эго

    «Не проще ли написать: меня забанили в сотнях мест, сотни модераторов, а я всё не унимаюсь?» Угомонитесь уже, я с вами не собираюсь мериться пиписками, да и вам ни к чему. Лучше соберите остатки интеллекта и принесите в топике всем, и мне в том числе пользу. Эмоции нам тут не нужны, давайте уже будем по-взрослому обсуждать интересную тему и не ребячиться? Мы же взрослые люди в конце концов. зы. Ну и напоследок. Киса, а зачем вам деньги? Вы ведь уже старенький (с) О. Бендер. Не удержался…:) «Если ты говоришь на языке, не понятном никому, кроме тебя самого, и (sic!) никто даже не задаёт тебе наводящих вопросов, значит ты говоришь сам с собой. Здравствуй, шизофрения.» шизофрения-это раздвоение личности, а то, что вы назвали просто другой язык. Если я на этом языке думаю, то значит мне так удобнее и это приоритетнее, чем ваше понимание для меня. Т.е. разговаривая сам с собой на фоне вашего присутствия, в монологах, у меня рождаются какие-то мысли интересные, я для этого и пишу (это мой интерактивный способ получения знаний). Вот у Ашманова свой способ получения знаний, он тоже выглядит дураком когда его тыкают носом, но его устраивает, потому что приоритет полученных знаний выше, понимаете? Более того, у Ашманова ситуация выгоднее, он выглядит дураком только для тех, кто ему что-то объясняет и тыкает носом, для остального планктона он остается Гуру. Я не Ашманов и у меня так не получиться, мне приходится выглядеть дураком для всех, но как я указал выше, приоритеты важнее. Надеюсь внес ясность. Если мне нужно, чтобы меня поняли, я обычно пытаюсь перевести это на понятный язык страждущим. Обычно получается, но страждущих не много бывает. Если вам термин частотный граф понятнее, то пусть будет он, но мое название точнее, потому что лучше отражает смысл понятия. Имеющийся у яндекса частотный граф является смысловым оттиском базы знаний, которая естесственным образом упорядочена сама собой и уже классифицирована на самом деле в своей исходной структуре. Оттиск эту структуру сохраняет, естественно. Задача привести ее в Божеский вид (под названием классификатор в обычном понимании этого слова). Ну а поскольку основа его построения-частотная, то я и применил термин частотный классификатор. А вот с вами, vnaz, было бы интересно поговорить. но хотелось бы знать кто вы, чувствуется знание предмета. Яндексоид? «это соотношение сущностей в пространстве (ага, ТРЕХМЕРНОМ таки)» ну не зараза ли…значит яндекс все таки трехмерную модель строит? «чего не хватает?» понимания естественной организации всего вышенаписанного. Т.е не хватает обобщающего анализа, чтобы провести аналогию между имеющимися структурами физического взаимодействия тел и структурой взаимосвязей между понятиями, которые как раз обусловлены первым. Понимания физики не хватает, свойств объектов. Именно отсюда следует строить классификатор, указывая их в первых узлах и назначая им свойства. И еще очень важный момент. КАЖДЫЙ объект классификации после определения его свойств, должен безусловно их выполнять, по дефолту.

  • Ответить

    На мне нет плаща мушкетера, но душой я мушкетер! (с) > Понимания физики не хватает не надо никакого понимания физики.. свойство «прозрачность» либо двоичное (да — нет), либо числовое (полупрозрачный, сквозь него просвечивает).. такими (именно либо «да-нет», либо степенями) категориями мыслят нормальные люди, и как раз проблемы взаимопонимания часто возникают из-за того, что один излагает двоично, а другой — по шкале.. > КАЖДЫЙ объект […] должен Вообще, в жизни редко кто что-то прямо вот должен.. А узел описания знаний вообще, по определению, ничего не может быть должен.. он просто существует в той или иной реальности..

  • Ответить
    Альтер Эго

    а понимание физики в данном контексте как раз и означает то, что вы сказали. начинать надо с двоичной шкалы узлов и растягивать ее по мере роста структуры классификатора. Обратите внимание, как дети постигают значения этих сущностей. Они сначала у них двоичны. Понятие «быстро» и «медленно» для них определяется теми скоростями, которые они вокруг себя наблюдают и пределы выставляются соответственно. «Вообще, в жизни редко кто что-то прямо вот должен.. » увы, всегда и везде. если вы никому/чему ничего не должны-то вы перестаете существовать вообще. Люди вон даже после смерти остаются кому-нибудь должны :) Это касается всех объектов абсолютно. Их свойства и есть их «ДОЛГИ» перед структурой, в которой они определены. Золото должно быть желтым, медь красной и т.д.

  • Ответить
    Игорь Ашманов Сам себе компания

    чего не хватает? Не хватает 15 лет, 70 миллионов долларов, 300 разработчиков и компании вроде Абби, которая зачем-то вам это всё предоставит. А так да, довольно аутентично описано то, что они и так делают.

  • Ответить
    Игорь Ашманов Сам себе компания

    Эмоции нам тут не нужны, давайте уже будем по-взрослому обсуждать интересную тему и не ребячиться? Мы же взрослые люди в конце концов. Вот редкий момент просветления. У совсем пожилых бабушек такие бывают, когда они говорят «господи, да я же сумасшедшая». Хватает обычно на полчаса, иногда на полдня. ОК. Предположим, что призыв я услышал. Давайте обсуждать тему. Мы собственно, здесь ровно это и делали, пока вы не прибежали под четырьмя никами и не начали троллить. Я готов обсуждать тему даже с Таром-729 (с остальными-то мы и так обсуждаем), если: — вы перестанете пейсать простыни по три экрана, без начала и конца, с постоянными ответвлениями и радостными ухмылками по поводу того, какая очередная гениальная идея только что залетела в голову; — больше не употребите слов «вам не понять» и их разнообразных синонимов, то есть не будете занимать «позицию с приставкой сверху» просто на уровне лексики; — перестанете каждый пост упоминать деньги (которых вам никак всё нидадуд); это ваш комплекс, нам он не очень интересен. То есть нужно всего-то ничего: перестать тут тешить своё самолюбие, а начать обсуждать что-то по существу. И быть готовым, что гениальные идеи могут оказаться не столь уж гениальны, а самодельные термины не помогают делу. Это непросто, но возможно — хотя бы полдня. Я думаю, остальные немногие подписчики этого топика ко мне присоединятся в этих пожеланиях.

  • Ответить

    нет, как раз не надо начинать с двоичной.. надо записывать или в двоичной, либо в скалярной, указывая, какого типа это свойство.. кроме того, надо уметь записывать значения свойств относительно свойств других сущностей.. возьмем к примеру, фразу «Тарасов умнее Ашманова».. нужно записать так: свойство «умность» сущности.. нет, объекта с ижентификатором «Тарасов» класса «Человек».. нет, класса «Ученый».. выше, чем объекта «Ашманов» по версии мира объекта «Тарасов».. это же явный факт, кто с этим поспорит? мы не знаем, что значит свойство «умность» для «Тарасова», но нам это пох, мы просто описали факт соотношения объектов в какой-то версии реальности..

  • Ответить
    Альтер Эго

    И несомненно вас в роли руководителя этой компании, чтобы пить с Воложем пиво наравне? да ну что такое, опять вы своими репликами отвлекаете, Игорь! Прекратите сейчас же меня провоцировать. Я же человек, и ничто человеческое (глум) мне не чуждо. Кстати, а зачем так много денег и 15 лет? Чтобы как в той притче про говорящего осла? «мы не знаем, что значит свойство «умность» для «Тарасова», но нам это пох, мы просто описали факт соотношения объектов в какой-то версии реальности..» Правильно, только грамотнее было бы сказать не реальности, а ветке классификатора. «надо уметь записывать значения свойств относительно свойств других сущностей..» ну, это и так уже реализовано на самом деле. Направленный граф как раз и несет в себе вектор отношения между объектами. «Это непросто, но возможно — хотя бы полдня.» Ваш призыв я услышал. К вам тоже просьба не провоцировать меня и не употреблять мое имя в сочетании со всякими перлами. И научитесь уже правильно его писать: tar729 без тире.

  • Ответить

    >> чего не хватает? > Не хватает 15 лет Игорь, Вы скажите, чего не хватает в описанной модели, а не для ее реализации.. и вообще, кастую Умку..

  • Ответить
    Альтер Эго

    «несет в себе вектор отношения между объектами.» если хотите, я вам наглядно покажу это на вордстате. выковыривайте из частотного графа это, нет проблем.

  • Ответить

    > грамотнее было бы сказать не реальности, а ветке классификатора да нет, я сказал так, как надо — это конкретная версия реальности, которую мы можем записать.. а то, что она может быть реализована в виде ветвления всеобъемливающего классификатора относительно конкретной картины мира, которую кто-то видит, или как пересечение других версий с конкретной — это детали реализации, мы до них еще не добрались..

  • Ответить
    Альтер Эго

    да вот нифига это не другая реальность, а все та же и упакованная в одном месте. вот она и записана эта ваша реальность вот так. http://wordstat.yandex.ru/?cmd=words&…0 от мартини до водки расстояние 19 пунктов (смотрим правую колонку) http://wordstat.yandex.ru/?cmd=words&…a9e3d76dc4 а от водки до мартини расстояние меньше, всего 7 Т.е. это как раз и есть ваши «разные реальности» обусловленные разной точкой отсчета. В первом случае расстояние дальше, потому что последовательность поведения (желаний и интересов) ведущая от мартини к водке во всем многообразии путей от одного напитка к другому, длиннее или маловероятнее (что по сути одно и то же). Дамам покупают мартини, чтобы споить их и до водки в «сессии» пикапера доходит редко. А вот когда вы покупаете водку и вас потом тянет на баб, то вы бежите за мартини, и это частое явление, судя по направленному графу. Т.е. записано уже все. Нужно только выковырять это и запихать в структуру, что яндекс и делает (но последнее время я стал сомневаться в этом на основании полного непонимания того же Ашманова, о чем я говорю). Тут либо Ашманов и многие другие, кого могжно было бы заподозрить в инсайдерской инфе не в курсе вообще ничего, либо Яндекс не использует то, что плавает на поверхности. Т.е. частотный граф содержит в себе структуру потребления, и вообще всех возможных отношений между объектами, т.е. смысл этих объектов зашифрован в частотном графе (классификаторе понятий структурированного по частотному признаку применимости понятий между собой). Заметьте, что все многообразие реальностей отношений водки к мартини здесь не уместилось, уместилась лишь вероятность некоторого множества нереализованных событий. Т.е. мы имеем дело на с конкретными взаимосвязями, а с их проекциями, находящихся все в одном измерении-в запросном графе. И такая конструкция не нуждается в воспроизведении всего множества вероятных реальностей. Они могут быть навешены на нее, как на елку и составлять свои собственные измерения. Вспомните про пример, о котором я говорил, что для безопасности дорожного движения нужно не знание всего множества возможных ситуаций, а соблюдение правил дорожного движения, из которых потом моделируется течение событий между объектами в произвольной ситуации на дороге. Зачем записывать все возможные ситуации? Они прекрасно моделируются при условии, что все объекты выполняют СВОИ свойства по дефолту. Теперь вы понимаете, зачем объектам классификатора выполнять свои дефолтные свойства? Как раз для того, чтобы моделировать их поведение в любой из возможных реальностей.

  • Ответить
    Альтер Эго

    А вот еще интересный вопрос: почему от «рука» до клитор» — близко, а от «клитор» до «рука» — далеко?

  • Ответить
    Альтер Эго

    «чего не хватает? Не хватает 15 лет, 70 миллионов долларов, 300 разработчиков и компании вроде Абби, которая зачем-то вам это всё предоставит. А так да, довольно аутентично описано то, что они и так делают.» 5 миллионов долларов и 5 лет, 10 разработчиков и компания типа s-tar729 кто меньше? «А вот еще интересный вопрос: почему от «рука» до клитор» — близко, а от «клитор» до «рука» — далеко?» Тут Остап не знал что ответить и у него вырвалось: Видите ли милостивый государь, ибо…ибо… жжошь! альтер эго.

  • Ответить

    Вы опять всё путаете.. я веду разговор о структуре данныых, которые сами по себе описывают какую-то реальность.. а Вы мне про статистические методы выявления реальности, т.е. про частный случай реальности — среднестатистической.. вместо очередной портянки лучше бы изложили это Ваше знание в формализованном виде.. типа, класс «мужики» «жрут» (заливают в себя, т.е. это процесс «помещение внутрь себя») объект класса «водка».. при возникновении желания породить процесс соития (вроде чисто пространственное изменение — «поместить часть себя в объект противоположного пола», хотя тут цель — достижение своего состояния «оргазм» или «дешевное равновесие») возможно возникновение процесса смены положения сушности класса «мартини» из первоначального (магазин) в целевое — в объект класса «женщена».. и че Вы мне тут про вордстат парите?

  • Ответить
    Альтер Эго

    Понятно, моя роль как бе ясна, а ваша какая? Мне-то какой интерес напрягаться и переводить все это на удобный вам язык? Вы мне что-нибудь ценное скажете? И Вы уж приложите сами как-то усилия, чтобы известное мне вам в голову заехало с минимумом моих усилий. Не нравятся мои портянки- будете свои сами нюхать с прогнозируемым заранее эффектом-нулевым. «я веду разговор о структуре данныых, которые сами по себе описывают какую-то реальность..» Вы упорно не хотите замечать указанные закономерности в вордстате, характерные для ВСЕХ запросов. Не хотите видеть те же аналогии в существующей реальности, и не хотите видеть в уже имеющейся структуре вордстата то, что ищете (сама по себе описывает). «а Вы мне про статистические методы выявления реальности, т.е. про частный случай реальности — среднестатистической..» А вот и нет. Я вам талдычу про правила, по которым существует эта самая реальность в КАЖДОМ из ее частных случаев. Трудности с обобщением? «вместо очередной портянки лучше бы изложили это Ваше знание в формализованном виде..» Не слишком многого хОчете? Почему бы вам не воспользоваться тем, что вам дают?: 1) Непосредственные указания на закономерности, которых вы сами не видите. 2) Конкретные наводки на принцип организации саморазвивающейся структуры классификатора, которая САМА должна генерить вопросы. 3) Конкретные намеки на то, с чего следует начинать построение такой структуры и как должны строиться начальные пределы. Вам все разжуй да в ротик положи…не красиво хотеть больше, чем способны дать взамен. С Ашманова вон, хоть шерсти клок получу. А с вас что взять? Вы почему-то только о себе думаете. Поддержите разговор, попробуйте развить тему с моих подач, а не можете-вы мне не интересны, уж извините.

  • Ответить
    Игорь Ашманов Сам себе компания

    Не нравятся мои портянки, будете свои сами нюхать с прогнозируемым заранее эффектом. Вижу, что метафора сильная, но что означает — не могу понять. Не хватает прагматических знаний в данной ПО. Какой эффект заранее прогнозируем?

  • Ответить

    > Вы опять всё путаете.. я веду разговор о структуре данныых, которые сами по себе описывают какую-то реальность.. Вась, а зачем тебе это?

  • Ответить
    Альтер Эго

    Будет кайфово если запустят. Со времен МатриксНета не было ни одного серьезного изменения, а МатриксНету уже три года. Пора выпускать какие-нибудь обновления.

  • Ответить

    ну, в основном пока чисто по приколу, хотя и другие причины были в свое время этим заниматься, которые сейчас (скорее, временно :) неактуальны :)

  • Ответить

    Вы только что опровергли мое эмпирическое правило, по которому дальше сотого комментария в топиках ничего содержательного не появляется. Поздравляю.

  • Ответить
    Альтер Эго

    А как вы умудрились высказать несколько сотен комментариев и не уйти как обычно в тему иммиграции? Хорошо или плохо иммигрировать? Позор или счастье? Предательство или геройство? Где лучше в США или в России?

  • Ответить
    Альтер Эго

    Мне по секрету рассказали, что искусственный интеллект это не продукт, и не проект, а баг особого рода управляемый управляемым управленцем. Управляемый управленец это управленец управляемый управляемым управленцем. То есть если Ашманов не врет и в Яндексе действительно есть искусственный интеллект, то там есть по меньшей мере один управляемый управленец. А это ведет к наличию бесконечного числа управляемых управленецН предполагая, что нет циклов в управлении, а циклов у управляемых управленцев никогда не бывает.

  • Ответить
    Альтер Эго

    Смешно. Рассказад про управляемых управленец и обнаружил пост, что в Яндексе запустили ПМную структуру подобную Микрософт, где менеджеры коммандуют («управленчески управляют» разработчиками) . ПМ и есть Управляемый Управленец.

  • Ответить

    Товарищ Ашманов! В отношении эпизода, произошедшего во Вьетнаме. Вьетнамцам, как людям, наделенным как здравым смыслом (то, что называют street wise), так и логикой, сразу стало ясно, что в данных ЛК имеет место ошибка. Да это ясно и людям, совсем не знакомым ни с Вьетнамом, ни с данной темой. Вдвое за полгода — рост фантастический, должен действовать какой-то очень значимый системный фактор. Однако ваша жена, будучи — не абы кто, а генеральным директором ЛК — не только не заметила этой несообразности, да еще и спорила! А ведь она сама должна была это заметить — если не на этапе подготовки доклада, то во время своего выступления! И после это вы пиарите ее опыт и интеллект?

  • Ответить
    Альтер Эго

    Tar729, очень жаль, что вам так нравится все время стоять в обвинительной позиции и обличать других в том, что они сделали не так. У вас всегда все через пять минут перед вами виноваты и вам должны, один вы белый и пушистый. Такое чувство, что вы большую часть времени либо занимаетесь самолюбованием, либо рассказываете другим, какие они нехорошие. При этом еще регулярно перекладываете ответственность за свои поступки на других людей. Буквально, на уровне — вы украли конфетку, у вас ее отобрали, но вы тут же готовы смешать другого человека с дерьмом, ведь обидели, конечно, именно вас. Из-за этого получается, что когда вы говорите правильные, разумные вещи, вас уже к тому моменту совершенно не хочется слушать, потому что уже известно, что смысл общения для вас сводится к тому, чтобы доказать другому человеку, что он дурак и вам что-то должен.

  • Ответить

    Во-первых, я вовсе не Tar, и даже не знаю, кто это. Во-вторых, о существовании этого ресурса я узнал лишь сегодня утром и это был мой первый пост. В третьих, даже если следовать вашей логике, то я высказал правильную, разумную вещь, а заключение о том, что внимать ей не следует, поскольку ранее некто Tar занимался самолюбованием, неосновательно, поскольку — см. «во-первых» — я вовсе не Tar. Вообще, для меня — думаю, что и для всякого разумного человека — важна исключительно правильность или неправильность суждения, а вовсе не мотивы, по которым оно было высказано. Касперская сделала глупость? Да, это очевидно. Так признайте это, зачем спорить о моих мотивах. Или опровергните мое утверждение. Если получится. Все остальное — просто сотрясение воздуха (или клавиатуры).

  • Ответить
    Альтер Эго

    Касперская сделала глупость? Касперская сделала глупость. Вообще, для меня — думаю, что и для всякого разумного человека — важна исключительно правильность или неправильность суждения, а вовсе не мотивы, по которым оно было высказано. Значительная часть суждений в жизни — оценочные, поэтому правильность или неправильность у них не абсолютная, а относительная (относительно вашей собственной системы координат). Поэтому мотивы и вообще бэкграунд человека, который высказывает суждение, как раз очень интересны, и местами просто критичны.

  • Ответить

    Ну, вот мы с вами и договорились. Естественно, я имел в виду те суждения, которые можно верифицировать. Интерес к мотивам и бэкграунду автора, а не к его идеям,свойственен психологии и социальным наукам. Для них вполне естественно. О таком подходе я сразу не подумал. Наверное, вы психолог.

  • Ответить
    Игорь Ашманов Сам себе компания

    Отличный способ — привязываться к человеку на основании его же рассказа, додумав всякую чушь, чтобы его же обвинить в какой-то нелепости. Уважаемый, достаточно хотя бы вот этой ерунды: «Однако ваша жена, будучи — не абы кто, а генеральным директором ЛК — не только не заметила этой несообразности, да еще и спорила!», чтобы получить достаточное представление о вашей склонности включать голову и примерной мощности этой головы. Жена моя Наталья не была генеральным директором ЛК в этой сцене и она не спорила с вьетнамцами. Вы даже пост на Роеме прочитать внимательно труда себе не даёте. И ничего очевидного в такой ситуации не бывает. Никакой несообразности в рост заражённости целой страны вдвое за полгода — нет и быть не может. Такие скачки бывают и за неделю, и за сутки. Например, когда появился первый червь с SQL-инъекцией, заражённость компьютеров в Южной Корее выросла за сутки в тысячи раз, а в России или Европе — нет. Просто вы в этом не очень разбираетесь, лучше бы вам не выпендриваться на пустом месте.

  • Ответить

    > Например, когда появился первый червь с SQL-инъекцией, заражённость компьютеров в Южной Корее выросла за сутки в тысячи раз, Т.е. в Корее уровень «зараженности» был ниже полпромилле? Счастливые люди в той стране!

  • Ответить
    Альтер Эго

    > заражённость компьютеров в Южной Корее выросла за сутки в тысячи раз, а скорость света = триста тысяч километров в секунду. Представляете, какие скорости бывают!