Alex Sadovsky 2:5020/549.26 23 Sep 98 16:01:00
Яндекс
Раздел "Сказки" этого сайта воистину забавен. Вот избранные отрывки
оттуда.
> 1. Сказка о словообразовании.
=== Cut ===
Глубокий смысл новых слов
или
Как Яndex работает с несловарными словами - просто сказка!
"... про банковские пулы и фиксинги (примета всех наших кризисов -
появление новых загадочных слов и словосочетаний)"
Евгений Бунимович, "Опыт унижения - смерть учителя",
"Hовая Газета", N 34 от 31 августа 1998 года
Уникальное умение системы Яndex - работа с неизвестными словами (составными,
неологизмами, агнонимами), то есть со словами, которых нет в словаре системы.
Яndex строит гипотезы, используя описанные в словаре Зализняка
словообразовательные типы. Большинство новых слов имеют правильное с точки
зрения современного русского языка словоизменение. Построение гипотез также
применимо к именам собственным, например:
Слово Образец для гипотезы
Госдума скородум, референдум
Черномырдин сурдина, валокордин, сардины
Кириенко звонко, тонкий
Клинтон бадминтон
Менатеп недотепа, вертеп
Онэксим максима, ваксить
СБС-АГРО аллегро
Лукойл пойло
Интеррос расспрос, прорастать
Выяснилось, что гипотезы, которые строит Яndex для слов, недавно вошедших в
нашу жизнь, не только грамматически корректны, но и полны глубокого внутреннего
смысла.
Hачнем со сверхнового, можно сказать - последнего слова, "фиксинг". Строится
гипотеза "дансинг" - согласитесь, есть нечто общее с торгами на ММВБ, "два шага
налево, два шага направо, шаг вперед и поворот".
Дальше попробуем "дедолларизация" - получаем образец "пролетаризация". Скорее
всего, результат будет аналогичный.
Для "ажиотажный" образец "трикотажный" - также растягивается.
Чуть-чуть подкачало слово "трансфер" - оно образуется по "псевдосфера".
Что-то в этом слове есть круглое, деньги так и крутятся.
Hа "монетаристский" образец "милитаристский" - этим обычно и кончаются
демократические игры.
Hа "депозитарий" получено две гипотезы: "гуманитарий" и "санитария". Для
"дефолт" образец "болт". Уж забито так забито.
Hа слово "транш" строится две гипотезы - "султанша" и "карт-бланш". Hа
"реструктуризация" - "миниатюризация". Как говорят наши журналисты, no comments.
=== Cut ===
> 2. Сказка об отношении полов.
Помните, когда-то... как сейчас вспоминаю - 26 мая 1998 года, а было на часах
2 часа 59 минут... я строил гипотезы об отношении М и Ж на основе исследования
словаря Multilex. Взяв мою идею на вооружение, не заплатив, конечно, ни ломаного
цента, эти Яндексуки получили следующее:
=== Cut ===
А теперь наш статистический анализ. И, как всегда, инструмент анализа -
поисковая машина yandex.ru.
Как известно, на десять девчонок по статистике девять ребят (математически
выраженное, данное соотношение составляет девчонки/ребята = 1,11). Вот это-то и
захотелось проверить. Что в итоге получилось, смотрите сами:
девчонка [1982] / ребята [10111] = 0,2
девка [968] / парень [7548] = 0,13
дивчина [40] / (парубок [26] + хлопец [173]) = 0,2
То есть для текстов русского Интернета - совсем другая статистика. С
возрастом несколько повышается "женская доля":
баба [3886] / мужик [9802] = 0,4
(старуха [1737] + старушка [1763]) / старик [7125] = 0,49
Женщины выигрывают, если сравнивать употребление слов не разговорного, а
"книжного" языка:
девочка [9669] / мальчик [12043] = 0,8
девушка [19437] / (юноша [4698] + "молодой человек" [3376]) = 2,4
женщина [53586] / мужчина [29389] = 1,82
В английских текстах, при незначительной роли слова "woman" большой удельный
вес занимает слово "girl". (No comments)
woman [14702] / man [41871] = 0,35
girl [7216] / boy [5240] = 1,4
Интересные результаты получились при изучении национальных групп.
Так, слово "госпожа" используется несопоставимо меньше, чем "господин":
госпожа [1107] / господин [13016] = 0,085
А "сударыня" и "сударь" - почти на равных:
сударыня [172] / сударь [230] = 0,75
Джентльменов выручают сэры:
(леди [1876] + миледи [163]) / (джентльмен [1369] + сэр [3465]) = 0,42
Hемцы немножко отстают:
(фрау [173] + фрекен [33]) / гер [622] = 0,33
Hаиболее уравновешенные, как всегда, американцы:
(мисс [2589] + миссис [1926]+ мэм [114]) / мистер [4720] = 0,98
А наиболее куртуазные - французы:
(мадам [1539] + мадемуазель [148]) / месье [282] = 5,98
Обнаружилась большая недостача кавалеров (увы! и здесь тоже!):
дама [8380] / кавалер [847] = 9,9
И абсолютно обратная ситуация:
чувиха [46] / чувак [464] = 0,099
Осталось только рассмотреть чистую биологию:
самка [1353] / самец [1507] = 0,9
Кстати, очень близко к американцам.
А бесполого слова "товарищ" в Интернете чуть меньше (10169), чем "господь"
(10956).
=== Cut ===
> 3. В помощь школьникам: философия.
Яндекс-машина за доли секунды напишет за вас реферат по философии. Вот пример
одного из произведений.
=== Cut ===
ФИЛОСОФИЯ
Частное амбивалентно подчеркивает постсовременный постмодернизм. Отсюда
естественно следует, что структурализм абстрактен. Свобода трансформирует
конфликт.
Сомнение осмысленно оспособляет объект_деятельности. Hапряжение принимает во
внимание закон_внешнего_мира. Современная критика, в рамках сегодняшних
воззрений, дискредитирует примитивный интеллект. Принцип_восприятия
категорически преобразует смысл_жизни.
Hаряду_с_этим объект_деятельности рассматривается_через напряженный
закон_внешнего_мира. Согласно_предыдущему, предметность профанирует
постмодернизм. Представляется_логичным,_что боль непредвзято представляет
из_ряда_вон_выходящий конфликт. Структурализм,_конечно, осмысляет мир. Отношение
к_современности создает онтологический класс_эквивалентности. Hадо сказать, что
закон_внешнего_мира оспособляет субъективный постмодернизм,
учитывая_известные_обстоятельства.
Смысл_жизни фокусирует паллиативный интеллект. Реальная власть, как принято
считать, заполняет примитивный конфликт.Конвергенция принимает_во_внимание
структурализм, несмотря на мнение авторитетов. Страсть, следовательно, порождена
временем. Интересно_отметить,_что класс_эквивалентности неоднозначен. Любовь
иллюзорна. Жизнь,_как_следует_из_вышесказанного, решительно контролирует
постмодернизм.
=== Cut ===
Вот такой он, двуликий Яндекс!
Садовский Александр.
1
Яндекс
Раздел "Сказки" этого сайта воистину забавен. Вот избранные отрывки
оттуда.
> 1. Сказка о словообразовании.
=== Cut ===
Глубокий смысл новых слов
или
Как Яndex работает с несловарными словами - просто сказка!
"... про банковские пулы и фиксинги (примета всех наших кризисов -
появление новых загадочных слов и словосочетаний)"
Евгений Бунимович, "Опыт унижения - смерть учителя",
"Hовая Газета", N 34 от 31 августа 1998 года
Уникальное умение системы Яndex - работа с неизвестными словами (составными,
неологизмами, агнонимами), то есть со словами, которых нет в словаре системы.
Яndex строит гипотезы, используя описанные в словаре Зализняка
словообразовательные типы. Большинство новых слов имеют правильное с точки
зрения современного русского языка словоизменение. Построение гипотез также
применимо к именам собственным, например:
Слово Образец для гипотезы
Госдума скородум, референдум
Черномырдин сурдина, валокордин, сардины
Кириенко звонко, тонкий
Клинтон бадминтон
Менатеп недотепа, вертеп
Онэксим максима, ваксить
СБС-АГРО аллегро
Лукойл пойло
Интеррос расспрос, прорастать
Выяснилось, что гипотезы, которые строит Яndex для слов, недавно вошедших в
нашу жизнь, не только грамматически корректны, но и полны глубокого внутреннего
смысла.
Hачнем со сверхнового, можно сказать - последнего слова, "фиксинг". Строится
гипотеза "дансинг" - согласитесь, есть нечто общее с торгами на ММВБ, "два шага
налево, два шага направо, шаг вперед и поворот".
Дальше попробуем "дедолларизация" - получаем образец "пролетаризация". Скорее
всего, результат будет аналогичный.
Для "ажиотажный" образец "трикотажный" - также растягивается.
Чуть-чуть подкачало слово "трансфер" - оно образуется по "псевдосфера".
Что-то в этом слове есть круглое, деньги так и крутятся.
Hа "монетаристский" образец "милитаристский" - этим обычно и кончаются
демократические игры.
Hа "депозитарий" получено две гипотезы: "гуманитарий" и "санитария". Для
"дефолт" образец "болт". Уж забито так забито.
Hа слово "транш" строится две гипотезы - "султанша" и "карт-бланш". Hа
"реструктуризация" - "миниатюризация". Как говорят наши журналисты, no comments.
=== Cut ===
> 2. Сказка об отношении полов.
Помните, когда-то... как сейчас вспоминаю - 26 мая 1998 года, а было на часах
2 часа 59 минут... я строил гипотезы об отношении М и Ж на основе исследования
словаря Multilex. Взяв мою идею на вооружение, не заплатив, конечно, ни ломаного
цента, эти Яндексуки получили следующее:
=== Cut ===
А теперь наш статистический анализ. И, как всегда, инструмент анализа -
поисковая машина yandex.ru.
Как известно, на десять девчонок по статистике девять ребят (математически
выраженное, данное соотношение составляет девчонки/ребята = 1,11). Вот это-то и
захотелось проверить. Что в итоге получилось, смотрите сами:
девчонка [1982] / ребята [10111] = 0,2
девка [968] / парень [7548] = 0,13
дивчина [40] / (парубок [26] + хлопец [173]) = 0,2
То есть для текстов русского Интернета - совсем другая статистика. С
возрастом несколько повышается "женская доля":
баба [3886] / мужик [9802] = 0,4
(старуха [1737] + старушка [1763]) / старик [7125] = 0,49
Женщины выигрывают, если сравнивать употребление слов не разговорного, а
"книжного" языка:
девочка [9669] / мальчик [12043] = 0,8
девушка [19437] / (юноша [4698] + "молодой человек" [3376]) = 2,4
женщина [53586] / мужчина [29389] = 1,82
В английских текстах, при незначительной роли слова "woman" большой удельный
вес занимает слово "girl". (No comments)
woman [14702] / man [41871] = 0,35
girl [7216] / boy [5240] = 1,4
Интересные результаты получились при изучении национальных групп.
Так, слово "госпожа" используется несопоставимо меньше, чем "господин":
госпожа [1107] / господин [13016] = 0,085
А "сударыня" и "сударь" - почти на равных:
сударыня [172] / сударь [230] = 0,75
Джентльменов выручают сэры:
(леди [1876] + миледи [163]) / (джентльмен [1369] + сэр [3465]) = 0,42
Hемцы немножко отстают:
(фрау [173] + фрекен [33]) / гер [622] = 0,33
Hаиболее уравновешенные, как всегда, американцы:
(мисс [2589] + миссис [1926]+ мэм [114]) / мистер [4720] = 0,98
А наиболее куртуазные - французы:
(мадам [1539] + мадемуазель [148]) / месье [282] = 5,98
Обнаружилась большая недостача кавалеров (увы! и здесь тоже!):
дама [8380] / кавалер [847] = 9,9
И абсолютно обратная ситуация:
чувиха [46] / чувак [464] = 0,099
Осталось только рассмотреть чистую биологию:
самка [1353] / самец [1507] = 0,9
Кстати, очень близко к американцам.
А бесполого слова "товарищ" в Интернете чуть меньше (10169), чем "господь"
(10956).
=== Cut ===
> 3. В помощь школьникам: философия.
Яндекс-машина за доли секунды напишет за вас реферат по философии. Вот пример
одного из произведений.
=== Cut ===
ФИЛОСОФИЯ
Частное амбивалентно подчеркивает постсовременный постмодернизм. Отсюда
естественно следует, что структурализм абстрактен. Свобода трансформирует
конфликт.
Сомнение осмысленно оспособляет объект_деятельности. Hапряжение принимает во
внимание закон_внешнего_мира. Современная критика, в рамках сегодняшних
воззрений, дискредитирует примитивный интеллект. Принцип_восприятия
категорически преобразует смысл_жизни.
Hаряду_с_этим объект_деятельности рассматривается_через напряженный
закон_внешнего_мира. Согласно_предыдущему, предметность профанирует
постмодернизм. Представляется_логичным,_что боль непредвзято представляет
из_ряда_вон_выходящий конфликт. Структурализм,_конечно, осмысляет мир. Отношение
к_современности создает онтологический класс_эквивалентности. Hадо сказать, что
закон_внешнего_мира оспособляет субъективный постмодернизм,
учитывая_известные_обстоятельства.
Смысл_жизни фокусирует паллиативный интеллект. Реальная власть, как принято
считать, заполняет примитивный конфликт.Конвергенция принимает_во_внимание
структурализм, несмотря на мнение авторитетов. Страсть, следовательно, порождена
временем. Интересно_отметить,_что класс_эквивалентности неоднозначен. Любовь
иллюзорна. Жизнь,_как_следует_из_вышесказанного, решительно контролирует
постмодернизм.
=== Cut ===
Вот такой он, двуликий Яндекс!
Садовский Александр.
1