Да полно всяких хитрых штук придумано (см. например классическую книжку по алгоритмам и мо). Каждый маленький шажок это зачастую серьезное интеллектуальное усилие.
Другое дело, что отличить настоящее изобретение от того, треша, которыми на 90% завалены патентное бюро практически невозможно. Также почти нереально проверить, что изобретение является уникальным в том смысле, что никто ничего такого ни придумывал раньше.
PS: всё бы еще ничего, если бы патенты не были написаны таким идиотским языком.
Мы все надеемся, что в результате этого отбора вымрет патентная система. Мы даже уверены в этом. Жаль, в этом время прекрасное жить не придется ни мне ни тебе.
> Если есть признаки, с точки зрения «патентной системы», роднящие алгоритм и химические формулы, значит алгоритм запатентовать тоже должно быть можно.
Конечно. А также заработать денег на разборках. Собственно это и есть основное предназначение патентов, а не пресловутая защита прав изобретателей.
Патенты в айти — это зло, потому что их абьюзят со страшной силой. И выигрывают в результате только тролли. В фарме есть химическая формула и формулу можно запатентовать. А что такое формула в айти? Вот взяли и реализовали модификацию вашего патента. Кто сможет определить сколько там осталось оригинального «алгоритма»? 10 или 50 процентов? Размер взятке судье или бюджета на судилища?
Понятно, что юристами патентные дела приносят прибыль. Всем остальным от этого только головная боль.
Снижает битрейт на лету это просит ютьюб ухудшить качество изображения? Это есть в стандартном протоколе для скачивания видео или работает только для некоторых известный вебхостингов?
Да ладно, не рассказываейте байки. Вон примерно год назад, несколько месяцев невозможно было постить комментарии в ЖЖ. Комментарии постились через раз. Это называется быстро чинятся?
Да как он посмел, вообще, права качать! Должен быть счастлив тем, что сидит в теплом уютном офисе, а не колымит в Магадане! Начальство недоедает-недосыпает ради их блага, а они, неблагодарные наймиты только и смотрят где бы кусок урвать.
>> Такое впечатление, что победа в Великой Отечественной Войне — наше единственное достижение. >Еще Гагарин. Еще Крым, как же про Крым забыли? А щаз еще и Донбасом прирастем.
Ну Тема и правда пишет оглушительное вранье, причем чего бы это не касалось: Европы, России, США, и пр… Все, что не написано, все жуткое завиралово и обсиралово. И даже понятно почему это происходит. Выброс негативных эмоций на разные горячие темы — это самый простой способ собрать кучу комментариев. А бурные обсуждения и высокие рейтинги это точно совершенно сигнальчик в мозг. Больше вранья — больше сигнальчиков. Педалька должна работать.
Может немного постабильнее стало с базовым софтом. Скажем Джава — зрелый язык программирования (20 лет как существует) она никуда не уходит. Даже Си-шарп уже больше 10 лет и тоже никуда не денется. Но, появляется много всего нового. Хадуп, сетевые сервисы (Amazon Cloud, Google App Engine), NoSQL, много всякого нового софта (вчера в POPе ковырялись, а теперь в Люсьене :-). Гораздо больше всего на Джава скрипте пишется. В общем, цирк продолжается по полной программе.
Очень модно говорить о быстро развивающемся IT и быстро устаревающих знания, но по-моему это не так. По модулю той тонны экскрементальных и проходящих технологий с которыми я ознакомился, склонен не верить данному высказыванию. Пусть технологии не за 5 лет умирают, а за десять даже с копейками. Десять это все равно мало. Если я начал учить подобную экскременатльность на пике популярности, то через пять лет она уже на излете и мало кому нужна. Вот, например, программирование интерфейсов под Виндоуз вполне эпохальная штука. Сначала люди писали код на простом Си и MFC, потом им пытались упростить жизнь с помощью всяких Вижуал Бейсиков, Джав, затем настал Си Шарп. Кроме этого добра была куча менее известных IDE от Сайбейза, Оракла, и никому неизвестных фирм а-ля 1С. А программисты многие это все изучали. И кому это добро сейчас нужно (кроме Си Шарпа и Джавы?)
Роман Янковский, как минимум Си шарп. А до этого как хотели всех посадить на Вижуал Бейсик. А были ведь до этого ужасы вроде ФоксПро. И где это все? Где Корба, где 33 интерфейса к базам данным от компании Майкрософт? Где, наконец, Дельфи? Еще один любопытный момент. Создается ощущение, что теперь гораздо меньше интеерса к DBA. Раньше специалист по Ораклу очень ценился, а сейчас уже меньше.
Да, только никто не знает, что именно товарищ будет программировать после окончания ВУЗа. Потребуется ли ему знание машинной графики, статистики, линейной алгебры и пр.? Может ему надо два года 1С изучать, или Оракл формс, или еще какую технологию, которая умрет завтра? Непозволительная роскошь это готовить каждый год 500 математиков на одном только мехмате, с весьма фундаментальным математическим образованием. Или там, когда половина выпускников ВМиК идет мимо программирования. А научить человека думать и базовой математике (ну не два семестра алгебры, три матана конечно же) очень даже полезная задача.
Так это сейчас не нужно, а завтра, глядишь, понадобится (не сайтами же едиными?). Машинным обучением все больше программистов начинают пользоваться. Вас же не призывают учить допглавы по уравнениям в частных производных. Про три семестера это у нас было, я не говорю, что это осмысленно в общем случае.
soomrack, проблема тут в том, что для приличного кругозора учить-то надо довольно много чего. Не знаю как там матмех, но у нас, например, линейная алгебра была больше двух семестеров, матан больше трех. Есть еще диффуры (пусть даже и обыкновенные), статистика (у нас ее, кстати, мало очень было), машинное обучение. К этому добавляется базовая алгоритмика и прочие базовые курсы по программированию. ООП (Джава или Си++), базы данных, функциональное там программирование, операционные системы. Если хочется иметь готового специалиста, к этим курсам добавляются всякие более специализированные курсы (вроде распределенных систем) и получается всего до фига и больше. Я сильно сомневаюсь, что это влезет в курс техникума. Думаю, что бакалаврские программы на 4 года — это более реалистичная штука. При этом интенсивность изучения предмета тоже много на что влияет. Вот, например, в классической программе российского ВУЗа, в программу умещают по 5-6 курсов с 4 экзаменами за семестр. А в американских ВУЗах любят навалить столько домашнего задания, что два курса в семестр валят наповал закаленных китайцев и индусов.
Отдельные виды работы не требуют фундаментального образования и техникума может оказаться достаточно. Но иногда, неожиданно, программистам без фундаментального программистко-математического образования вдруг приходится заниматься задачами, где такое образование требуется. Мой знакомый (без профильного образования) недавно пожаловался, что пришлось изучать матрицы, линейную алгебру, и пр… в связи с какой-то новой задачей. Но образование — это дорогая штука и поэтому тема образования будет вечной. Тут нет единого мнения. Например, мы видим, что 1) в одном и этом же Яндексе есть люди, создающие специализированные университеты, отправляющие сотрудников делать западные PhD, и пр… А, с другой стороны, Анатолий Орлов, который хорохорится и заявляет, что всех они доучать, а «в области задач machine learning они сильно впереди всяких институтов типа standford-а». 2) (Какие-то) люди из IBM толкают идею техникумов для программистов. При всем при этом IBM, Google, Microsoft и пр компании пытаются нанять выпускников ведущих ВУЗов еще до того, как они попадают на рынок. Кстати, во всех этих компаниях есть исследовательские подразделения. И попасть туда ни то, что после техникума, а даже с хорошим PhD может оказаться нетривиально. Недавно общался с рекрутерами одного немаленького хедж-фонда. Как бы секрет полишинеля, что хедж-фонды всячески стремятся нанять выпускников PhD-программ с математическим, физическим и прочим казалось бы нереленватным образованием. Вы когда-нибудь задумывались на секундочку почему за выпускниками PhD программ, а не техникумов? Все больше и больше задач, где требуется хорошее знание математики (статистики, диффуров, линейной алгебры и пр) и алгоритмки. Всему, конечно, может научиться умный человек. Но начинать изучать матанализ и линейную алгербру в 40 лет может оказаться малость поздновато. А как без того же матанализу объяснять простейшую логистическую регрессию?
Реальность такова, что нужно очень тщательно выбирать стартап, которому ты посвятишь 5-7 лет, потому что когда все накроется, ты останешься с кучей листовок «акциями» и зарплатой которую ты откладывал на черный день, когда другие станут мультимилионерами в худшем случае. Это, хорошо сказано :-)
Да это не важно, на самом деле, какого размера город. И в даунтауне ты живешь или на некотором расстояния. Важно насколько там все удобно расположено, насколько он загружен, итд итп… В Нью-Йорке, кроме того, что там чуток больше театров, музеев, и едален, неудобно практически ничего. Город перегруженный, грязный, Нью-Йоркское метро — это постоянно ремонтирующийся ужас, следующий какому-то своему странному графику. И мне, к сожалению, там приходится бывать пару раз в году. Но я с содроганием думаю о том, что, не дай бог, там (или поблизости) придется жить/ Но, некоторые измеряют удобство исключительно размером города, и насколько там близок ужас под названием даунтаун.
Рядом с Рэдмондом Сиэттл находится. А, Нью-Йорк, прости господи, хорошего слова про него не скажешь. Та же Москва, только трафику чуток поменьше и воздух гораздо чище.
Это все прекрасно, только азиатские города лидеры по загрязненности воздуха (Японские, правда, кажется получше). Например, по PM2.5 они со свистом уделывают крупные города России. Типичный уровень PM2.5 в Москве порядка 30, а в Ханое он за сотню.
Чтож вы дорогой Эго слюной так брызжете, нежто за живое задело? Ручные правила лучше не потому, что ими можно на пользователя влиять, а потому что человек может быть умнее статистических алгоритмов. Но есть некоторая надежда, что баланс сдвигается в сторону статистических алгоритмов.
Секрет Полишенеля заключается в том, что, несмотря на весь шума вокруг так называемого машинного обучения, это все еще весьма сырая технология. На текущий момент, машинное обучение вряд ли позволяет создать лучшую формулу ранжирования. Что, кстати, показали в свое время Яху-соревнования по «машинному» ранжированию. Самые лучшие алгоритмы обгоняли простой baseline на какие-то жалкие несколько процентов. Если бы вместо простого бейзлайна сделали бы ручную формулу, могло бы так неожиданно получиться, что формула оказалась бы лучше всех машинных алгоритмов. Ну, совершенно точно не сильно хуже. Ясен перец, что в перспективе, ручные правила использовать это слишком трудоемко. Даже Гугл вряд ли сможет себе это позволить. Сейчас все больше появляется интересных факторов ранжирования, в частности, связанных с «глубокой» обработкой текста. Можно потратить миллиарды лет на вывод ручных формул для их комбинирования.
А чего это передовые Гуглы с Яндексами не могут взрастить Хинтов с Энгами у себя внутри, а нанимают их со стороны? Или там взять те же самые GBRT. Нежто их Яндекс придумал, поясните, пожалуйста.
На самом деле понятно почему тот же Ашманов не хочет соревноваться. Про качество поиска много чего известно и проиграть всякой школоте можно на раз. А так можно кричать о собственной крутизне. Ну это, конечно, отжиг на тему того, что РОМИПоподобные соревнования бесполезны. С учетом того, что именно так придумали всякие там BM25 и аналоги. И придумали их отнюдь не Ашмановы. Зато они теперь ими пользуются и утверждают, что это было бесполезно.
Какое оскорбление для барина, что «хорошую» морфологию сравнили с плохой и выяснилось, что для поиска особой радости нет, ай-ай-ай… Гораздо интереснее, что на вебовской коллекции преимущество морфологии заметно гораздо меньше. А ведь это только достаточная простая функция релевантности, даже без anchor text, кликов, логов и пользовательского поведения.
Аноним, не гневите пророка, ну нету никих удовлетворительных теорий семантики (то бишь теорий, которых можно было закодировать и сделать семантический поисковик). И, рискну предположить, что при нашей жизни мы их тоже не увидим. Да и даже для той же грамматики есть мульон альтернативных подходов и непонятно толком чем один хуже другого.
Anonymous coward, да ладно, что вы там такое рассказываете. Древние египтяне пользовались численными методами, а элементы матанализа индусы использовали за несколько веков до Лейбница.
> Серьезно? А что, за последние 30 лет психология совершила гигантский рывок и все старые идеи оказались за бортом? Или люди за 30 лет стали совершенно другими? Что произошло? Нет, не остались. Просто раньше там было все больше на уровне примеров, концепий, общих размышлений, а теперь стали сплошь статистические методы. И это коренным образом меняет дело.
Бездельник, прочистка чакров по уровню мракобесия соперничает с очисткой организма от шлаков. В любом случае, я бы никому не советовал очищать чакры такой старой книжкой. Как правило, такую древность можно читать только из исторического интереса. Я, каюсь, сам люблю такое периодически пролистать. Но только с целью поохать в духе: ах были люди в то время, все главные идеи придумали до нас. Но, как известно, идеи это хорош, а реализация — еще лучше. А современные реализации этих чакр несколько отличаются от того, что думали в 80х.
Вот вы будете смеяться, но по части морфологии я с Ашмановым согласен. Очень тяжело улучшить качество поиска с помощью одной лишь морфологии. В том смысле, что, если использовать грамматические формы в качестве синонимов слова запроса, пусть даже и с правильными весами. Дело в том, что в одних запросах это улучшает полноту, в других ухудшает точность. И в среднем получается примерно также, как и без морфлогии.
Дык, если поисковик будет обрабатывать какие-нибудь жалкие миллион пять запросов в день и индексировать, скажем, пару миллиардов документов, то 1000 серверов это может даже много оказаться.
Товарищ, очевидно, очень упрощает. Тот факт, что ответ можно найти на первых двух страницах поиска — это еще ничего не значит. Правильный факт нужно извлечь из страницы и понять, что именно он является ответом на вопрос. В этом состоит основная сложность. Не очень интересна система со 100% recall, когда у нее будет почти нулевая точность. И если так рассуждать, то Ватсон ничего особенного не добавляет по сравнению с Википедией. Если кто читатал айбиэмовские статьи, то, может быть, обратил внимание на тот факт, что больше 90% ответов можно получить из заголовоков статей/
Ну вот Ватсон работал на масштабе окрестности Википедии. При этом, было задействовано сотни серверов для ответа на один единственный вопрос (на человеческом языке и с большим контекстом, ака длинный вопрос). При этом большой вопрос, насколько подобные технологии помогают в обычных ad hoc запросах телеграфного стиля.
Просто прогресс в области качества поиска остановился, в том смысле, что с простыми статистическими методами далеко не уедешь, а сложные пока не работают на масштабе веба. Машинное обучение дает возможность немного улучшить качество, но для среднего запроса по больнице подобное улучшение довольно маленькое (посмотрите, например, результаты Yahoo learning to rank challenge). Самый лучший метод лучше (довольно-таки простой модели) меньше 10%. А можно и посложнее модель сделать. Клики и пользовательское поведение — это хорошая штука, но они, опять-таки, покрывают меньшую часть запросов.
Иван Ильин, подача патента от себя лично обречена на «успех». Нет, наверное, после двадцатого отвергнутого патента, ты сам научишься подавать. Но так обычно никто не делает. А услуги патентного поверенного стоят дорого.
Валерий, кто вам сказал, что по статистике у человека — одна грудь в среднем? Вас гнусно обманули. По статистике у примерно у половины людей — две (выдающиеся) груди, а у половины — 0. > «А про грудь я написал к тому, что какие-то выводы делать из общих данных бесполезно.» А пацаны-то не знали! Из плохой статистики делать выводы бесполезно, а из хорошей очень даже полезно.
Дискуссии пользователя
Да полно всяких хитрых штук придумано (см. например классическую книжку по алгоритмам и мо). Каждый маленький шажок это зачастую серьезное интеллектуальное усилие.
Другое дело, что отличить настоящее изобретение от того, треша, которыми на 90% завалены патентное бюро практически невозможно. Также почти нереально проверить, что изобретение является уникальным в том смысле, что никто ничего такого ни придумывал раньше.
PS: всё бы еще ничего, если бы патенты не были написаны таким идиотским языком.
Для общества пользы нет. Есть (довольно сомнительная) польза большим корпорация и несомненная польза для патентных поверенных.
Мы все надеемся, что в результате этого отбора вымрет патентная система. Мы даже уверены в этом. Жаль, в этом время прекрасное жить не придется ни мне ни тебе.
> Если есть признаки, с точки зрения «патентной системы», роднящие алгоритм и химические формулы, значит алгоритм запатентовать тоже должно быть можно.
Конечно. А также заработать денег на разборках. Собственно это и есть основное предназначение патентов, а не пресловутая защита прав изобретателей.
15 лет? Смотрите источники:
http://www.fda.gov/Drugs/DevelopmentApprovalProcess/ucm079031.htm#How%20long%20is%20exclusivity%20granted%20for?
Патенты в айти — это зло, потому что их абьюзят со страшной силой. И выигрывают в результате только тролли. В фарме есть химическая формула и формулу можно запатентовать. А что такое формула в айти? Вот взяли и реализовали модификацию вашего патента. Кто сможет определить сколько там осталось оригинального «алгоритма»? 10 или 50 процентов? Размер взятке судье или бюджета на судилища?
Понятно, что юристами патентные дела приносят прибыль. Всем остальным от этого только головная боль.
Понял, спасибо.
Снижает битрейт на лету это просит ютьюб ухудшить качество изображения? Это есть в стандартном протоколе для скачивания видео или работает только для некоторых известный вебхостингов?
Да ладно, не рассказываейте байки. Вон примерно год назад, несколько месяцев невозможно было постить комментарии в ЖЖ. Комментарии постились через раз. Это называется быстро чинятся?
Да ты, Кирилл, известный троль, что с тебя взять.
Да как он посмел, вообще, права качать! Должен быть счастлив тем, что сидит в теплом уютном офисе, а не колымит в Магадане! Начальство недоедает-недосыпает ради их блага, а они, неблагодарные наймиты только и смотрят где бы кусок урвать.
>> Такое впечатление, что победа в Великой Отечественной Войне — наше единственное достижение. >Еще Гагарин. Еще Крым, как же про Крым забыли? А щаз еще и Донбасом прирастем.
Ну Тема и правда пишет оглушительное вранье, причем чего бы это не касалось: Европы, России, США, и пр… Все, что не написано, все жуткое завиралово и обсиралово. И даже понятно почему это происходит. Выброс негативных эмоций на разные горячие темы — это самый простой способ собрать кучу комментариев. А бурные обсуждения и высокие рейтинги это точно совершенно сигнальчик в мозг. Больше вранья — больше сигнальчиков. Педалька должна работать.
Может немного постабильнее стало с базовым софтом. Скажем Джава — зрелый язык программирования (20 лет как существует) она никуда не уходит. Даже Си-шарп уже больше 10 лет и тоже никуда не денется. Но, появляется много всего нового. Хадуп, сетевые сервисы (Amazon Cloud, Google App Engine), NoSQL, много всякого нового софта (вчера в POPе ковырялись, а теперь в Люсьене :-). Гораздо больше всего на Джава скрипте пишется. В общем, цирк продолжается по полной программе.
Очень модно говорить о быстро развивающемся IT и быстро устаревающих знания, но по-моему это не так. По модулю той тонны экскрементальных и проходящих технологий с которыми я ознакомился, склонен не верить данному высказыванию. Пусть технологии не за 5 лет умирают, а за десять даже с копейками. Десять это все равно мало. Если я начал учить подобную экскременатльность на пике популярности, то через пять лет она уже на излете и мало кому нужна. Вот, например, программирование интерфейсов под Виндоуз вполне эпохальная штука. Сначала люди писали код на простом Си и MFC, потом им пытались упростить жизнь с помощью всяких Вижуал Бейсиков, Джав, затем настал Си Шарп. Кроме этого добра была куча менее известных IDE от Сайбейза, Оракла, и никому неизвестных фирм а-ля 1С. А программисты многие это все изучали. И кому это добро сейчас нужно (кроме Си Шарпа и Джавы?)
Роман Янковский, как минимум Си шарп. А до этого как хотели всех посадить на Вижуал Бейсик. А были ведь до этого ужасы вроде ФоксПро. И где это все? Где Корба, где 33 интерфейса к базам данным от компании Майкрософт? Где, наконец, Дельфи? Еще один любопытный момент. Создается ощущение, что теперь гораздо меньше интеерса к DBA. Раньше специалист по Ораклу очень ценился, а сейчас уже меньше.
Да, только никто не знает, что именно товарищ будет программировать после окончания ВУЗа. Потребуется ли ему знание машинной графики, статистики, линейной алгебры и пр.? Может ему надо два года 1С изучать, или Оракл формс, или еще какую технологию, которая умрет завтра? Непозволительная роскошь это готовить каждый год 500 математиков на одном только мехмате, с весьма фундаментальным математическим образованием. Или там, когда половина выпускников ВМиК идет мимо программирования. А научить человека думать и базовой математике (ну не два семестра алгебры, три матана конечно же) очень даже полезная задача.
Так это сейчас не нужно, а завтра, глядишь, понадобится (не сайтами же едиными?). Машинным обучением все больше программистов начинают пользоваться. Вас же не призывают учить допглавы по уравнениям в частных производных. Про три семестера это у нас было, я не говорю, что это осмысленно в общем случае.
soomrack, проблема тут в том, что для приличного кругозора учить-то надо довольно много чего. Не знаю как там матмех, но у нас, например, линейная алгебра была больше двух семестеров, матан больше трех. Есть еще диффуры (пусть даже и обыкновенные), статистика (у нас ее, кстати, мало очень было), машинное обучение. К этому добавляется базовая алгоритмика и прочие базовые курсы по программированию. ООП (Джава или Си++), базы данных, функциональное там программирование, операционные системы. Если хочется иметь готового специалиста, к этим курсам добавляются всякие более специализированные курсы (вроде распределенных систем) и получается всего до фига и больше. Я сильно сомневаюсь, что это влезет в курс техникума. Думаю, что бакалаврские программы на 4 года — это более реалистичная штука. При этом интенсивность изучения предмета тоже много на что влияет. Вот, например, в классической программе российского ВУЗа, в программу умещают по 5-6 курсов с 4 экзаменами за семестр. А в американских ВУЗах любят навалить столько домашнего задания, что два курса в семестр валят наповал закаленных китайцев и индусов.
soomrack, насколько я знаю, IBM — это не российский работодатель.
Отдельные виды работы не требуют фундаментального образования и техникума может оказаться достаточно. Но иногда, неожиданно, программистам без фундаментального программистко-математического образования вдруг приходится заниматься задачами, где такое образование требуется. Мой знакомый (без профильного образования) недавно пожаловался, что пришлось изучать матрицы, линейную алгебру, и пр… в связи с какой-то новой задачей. Но образование — это дорогая штука и поэтому тема образования будет вечной. Тут нет единого мнения. Например, мы видим, что 1) в одном и этом же Яндексе есть люди, создающие специализированные университеты, отправляющие сотрудников делать западные PhD, и пр… А, с другой стороны, Анатолий Орлов, который хорохорится и заявляет, что всех они доучать, а «в области задач machine learning они сильно впереди всяких институтов типа standford-а». 2) (Какие-то) люди из IBM толкают идею техникумов для программистов. При всем при этом IBM, Google, Microsoft и пр компании пытаются нанять выпускников ведущих ВУЗов еще до того, как они попадают на рынок. Кстати, во всех этих компаниях есть исследовательские подразделения. И попасть туда ни то, что после техникума, а даже с хорошим PhD может оказаться нетривиально. Недавно общался с рекрутерами одного немаленького хедж-фонда. Как бы секрет полишинеля, что хедж-фонды всячески стремятся нанять выпускников PhD-программ с математическим, физическим и прочим казалось бы нереленватным образованием. Вы когда-нибудь задумывались на секундочку почему за выпускниками PhD программ, а не техникумов? Все больше и больше задач, где требуется хорошее знание математики (статистики, диффуров, линейной алгебры и пр) и алгоритмки. Всему, конечно, может научиться умный человек. Но начинать изучать матанализ и линейную алгербру в 40 лет может оказаться малость поздновато. А как без того же матанализу объяснять простейшую логистическую регрессию?
Реальность такова, что нужно очень тщательно выбирать стартап, которому ты посвятишь 5-7 лет, потому что когда все накроется, ты останешься с кучей листовок «акциями» и зарплатой которую ты откладывал на черный день, когда другие станут мультимилионерами в худшем случае. Это, хорошо сказано :-)
Любопытно, сколько идут разговоры про смерть Яндекса, а доля Гугля так и не достигла 30%. Даже биржа уже не верит в то, что Яндекс будет сожран Гуглом в ближайшее время: https://www.google.com/finance?chdnp=1&chdd=1&chds=1&chdv=1&chvs=maximized&chdeh=0&chfdeh=0&chdet=1392334884004&chddm=265880&chls=IntervalBasedLine&q=NASDAQ:YNDX&ntsp=0&ei=Hlj9UuD0IrSIsgedew
Да это не важно, на самом деле, какого размера город. И в даунтауне ты живешь или на некотором расстояния. Важно насколько там все удобно расположено, насколько он загружен, итд итп… В Нью-Йорке, кроме того, что там чуток больше театров, музеев, и едален, неудобно практически ничего. Город перегруженный, грязный, Нью-Йоркское метро — это постоянно ремонтирующийся ужас, следующий какому-то своему странному графику. И мне, к сожалению, там приходится бывать пару раз в году. Но я с содроганием думаю о том, что, не дай бог, там (или поблизости) придется жить/ Но, некоторые измеряют удобство исключительно размером города, и насколько там близок ужас под названием даунтаун.
Рядом с Рэдмондом Сиэттл находится. А, Нью-Йорк, прости господи, хорошего слова про него не скажешь. Та же Москва, только трафику чуток поменьше и воздух гораздо чище.
Если в вашем стартапе мало стресса, значит, скорее всего, что-то делается в не не так.
Это все прекрасно, только азиатские города лидеры по загрязненности воздуха (Японские, правда, кажется получше). Например, по PM2.5 они со свистом уделывают крупные города России. Типичный уровень PM2.5 в Москве порядка 30, а в Ханое он за сотню.
Чтож вы дорогой Эго слюной так брызжете, нежто за живое задело? Ручные правила лучше не потому, что ими можно на пользователя влиять, а потому что человек может быть умнее статистических алгоритмов. Но есть некоторая надежда, что баланс сдвигается в сторону статистических алгоритмов.
Секрет Полишенеля заключается в том, что, несмотря на весь шума вокруг так называемого машинного обучения, это все еще весьма сырая технология. На текущий момент, машинное обучение вряд ли позволяет создать лучшую формулу ранжирования. Что, кстати, показали в свое время Яху-соревнования по «машинному» ранжированию. Самые лучшие алгоритмы обгоняли простой baseline на какие-то жалкие несколько процентов. Если бы вместо простого бейзлайна сделали бы ручную формулу, могло бы так неожиданно получиться, что формула оказалась бы лучше всех машинных алгоритмов. Ну, совершенно точно не сильно хуже. Ясен перец, что в перспективе, ручные правила использовать это слишком трудоемко. Даже Гугл вряд ли сможет себе это позволить. Сейчас все больше появляется интересных факторов ранжирования, в частности, связанных с «глубокой» обработкой текста. Можно потратить миллиарды лет на вывод ручных формул для их комбинирования.
А чего это передовые Гуглы с Яндексами не могут взрастить Хинтов с Энгами у себя внутри, а нанимают их со стороны? Или там взять те же самые GBRT. Нежто их Яндекс придумал, поясните, пожалуйста.
На самом деле понятно почему тот же Ашманов не хочет соревноваться. Про качество поиска много чего известно и проиграть всякой школоте можно на раз. А так можно кричать о собственной крутизне. Ну это, конечно, отжиг на тему того, что РОМИПоподобные соревнования бесполезны. С учетом того, что именно так придумали всякие там BM25 и аналоги. И придумали их отнюдь не Ашмановы. Зато они теперь ими пользуются и утверждают, что это было бесполезно.
Сколько лиц у нашей науки!
Какое оскорбление для барина, что «хорошую» морфологию сравнили с плохой и выяснилось, что для поиска особой радости нет, ай-ай-ай… Гораздо интереснее, что на вебовской коллекции преимущество морфологии заметно гораздо меньше. А ведь это только достаточная простая функция релевантности, даже без anchor text, кликов, логов и пользовательского поведения.
Аноним, не гневите пророка, ну нету никих удовлетворительных теорий семантики (то бишь теорий, которых можно было закодировать и сделать семантический поисковик). И, рискну предположить, что при нашей жизни мы их тоже не увидим. Да и даже для той же грамматики есть мульон альтернативных подходов и непонятно толком чем один хуже другого.
Anonymous coward, да ладно, что вы там такое рассказываете. Древние египтяне пользовались численными методами, а элементы матанализа индусы использовали за несколько веков до Лейбница.
Анонимус, ужас какой. Я чакрами чувствовал, что тут дело неладно, но вот сформулировать так точно не мог.
> Серьезно? А что, за последние 30 лет психология совершила гигантский рывок и все старые идеи оказались за бортом? Или люди за 30 лет стали совершенно другими? Что произошло? Нет, не остались. Просто раньше там было все больше на уровне примеров, концепий, общих размышлений, а теперь стали сплошь статистические методы. И это коренным образом меняет дело.
Бездельник, прочистка чакров по уровню мракобесия соперничает с очисткой организма от шлаков. В любом случае, я бы никому не советовал очищать чакры такой старой книжкой. Как правило, такую древность можно читать только из исторического интереса. Я, каюсь, сам люблю такое периодически пролистать. Но только с целью поохать в духе: ах были люди в то время, все главные идеи придумали до нас. Но, как известно, идеи это хорош, а реализация — еще лучше. А современные реализации этих чакр несколько отличаются от того, что думали в 80х.
Вот вы будете смеяться, но по части морфологии я с Ашмановым согласен. Очень тяжело улучшить качество поиска с помощью одной лишь морфологии. В том смысле, что, если использовать грамматические формы в качестве синонимов слова запроса, пусть даже и с правильными весами. Дело в том, что в одних запросах это улучшает полноту, в других ухудшает точность. И в среднем получается примерно также, как и без морфлогии.
Дык, если поисковик будет обрабатывать какие-нибудь жалкие миллион пять запросов в день и индексировать, скажем, пару миллиардов документов, то 1000 серверов это может даже много оказаться.
Товарищ, очевидно, очень упрощает. Тот факт, что ответ можно найти на первых двух страницах поиска — это еще ничего не значит. Правильный факт нужно извлечь из страницы и понять, что именно он является ответом на вопрос. В этом состоит основная сложность. Не очень интересна система со 100% recall, когда у нее будет почти нулевая точность. И если так рассуждать, то Ватсон ничего особенного не добавляет по сравнению с Википедией. Если кто читатал айбиэмовские статьи, то, может быть, обратил внимание на тот факт, что больше 90% ответов можно получить из заголовоков статей/
Ну вот Ватсон работал на масштабе окрестности Википедии. При этом, было задействовано сотни серверов для ответа на один единственный вопрос (на человеческом языке и с большим контекстом, ака длинный вопрос). При этом большой вопрос, насколько подобные технологии помогают в обычных ad hoc запросах телеграфного стиля.
Просто прогресс в области качества поиска остановился, в том смысле, что с простыми статистическими методами далеко не уедешь, а сложные пока не работают на масштабе веба. Машинное обучение дает возможность немного улучшить качество, но для среднего запроса по больнице подобное улучшение довольно маленькое (посмотрите, например, результаты Yahoo learning to rank challenge). Самый лучший метод лучше (довольно-таки простой модели) меньше 10%. А можно и посложнее модель сделать. Клики и пользовательское поведение — это хорошая штука, но они, опять-таки, покрывают меньшую часть запросов.
Друзья, сохраняйте свои статусы, они помогут вашему психиатру с диагнозом!
Ну я также надеюсь, что под немецким математиком не имеется в виду Кляйнберг. ЧТо тоже, конечно, шутка, но гораздо менее тонкая.
Ой, киньте ссылку на немецкого математика, или это тонкая шутка, что eigen немецкая приставка?
А, сорри, прочел криво. Возражение снимается :-)
Иван Ильин, подача патента от себя лично обречена на «успех». Нет, наверное, после двадцатого отвергнутого патента, ты сам научишься подавать. Но так обычно никто не делает. А услуги патентного поверенного стоят дорого.
От подачи патента до его получения проходят годы. Очень удобно: две тысячи мало кому придется платить.
С какого-то перепуга она хорошо исследованная область.
Валерий, кто вам сказал, что по статистике у человека — одна грудь в среднем? Вас гнусно обманули. По статистике у примерно у половины людей — две (выдающиеся) груди, а у половины — 0. > «А про грудь я написал к тому, что какие-то выводы делать из общих данных бесполезно.» А пацаны-то не знали! Из плохой статистики делать выводы бесполезно, а из хорошей очень даже полезно.