« Google не будет нас помнить до 2038 года | Главная | Подчеркивание в адресе будет разделителем »
July 25, 2007
Новости региона на Яндексе
Яндекс (бывший Интегрум) продолжает совершенствовать систему добычи фактов из текста, а именно региона сюжета. Полез смотреть новости Киева и первым обнаружил заголовок «В Израиле раскрыта сеть незаконной продажи человеческих органов». Наши везде есть! :)
С фамилиями, особенно нерусскими, тоже бывают казусы. Например глава МАГАТЭ Мухаммед Аль-Барадеи определяется как Мухаммед Магатэ. Ну и многочисленные варианты написания имен и фамилий, хотя здесь уже Яндекс.Новости абсолютно ни при чем.
Отправлено Cherny в July 25, 2007 9:50 AM
Комментарии
Глупая машина работает по шаблонам. А данных для анализа еще, наверное, не хватает. Интересно, при этом частота запросов со стороны пользователей учитывается, или нет?
Отправлено Ярослав Шакула в July 26, 2007 8:22 PM
Ярослав, машина на самом деле далеко не глупая и совсем не по шаблонам она работает. Принципы формирования текста имя+фамилия+что-то в разных странах сильно отличаются, в США например могут написать John F. Smith, во французском языке фигурирует приставка к фамилии de, это еще по романам Дюма можно заметить, арабские, китайские, корейские имена и фамилии - вообще мрак! Вот на Аль Барадеи система и споткнулась. А под заголовком с Израилем на самом деле была Украина, только ее с первого взгляда не видно.
Отправлено Cherny в July 27, 2007 2:55 PM