Чтение онлайн

на главную - закладки

Жанры

Шрифт:

Юл попытался сделать это... В результате появилась объемистая монография, посвященная вопросам языковой статистики. Примерно в то же время, в 40-х годах нашего столетия, статистическими законами языка занялся другой видный американский ученый — языковед Г. К. Ципф. И он пришел к несколько иным результатам, чем его коллега Удни Юл!

В чем же дело? Ведь законы статистики одни? Но... разгадка состоит в том, что, подсчитывая частоту слов — основу анализа, — они, по существу, исследовали разные явления, ибо под словом — единицей счета — подразумевались разные вещи. Юл считал словом то, что мы называем основой слова. Например, слова «стол», «стола», «столу», «столом» он считал одним словом.

Ципф же считал отдельным словом не только основу, но и все производные от нее словоформы. «Стол», «столу», «стола» и т. д. были для него разными словами.

При анализе пушкинской строки «глухой глухого звал на суд судьи глухого» Юл констатировал бы, что слово «глухой» встретилось три раза. А Ципф записал бы: слово «глухой» встретилось один раз и слово «глухого» два раза. Метод Ципфа был более удачен. На основании его был сформулирован так называемый «закон Ципфа», вызвавший первоначально удивление и сомнение, а затем восхищение лингвистов.

Математически он выглядит так:

Объясняется эта формула следующим образом. Подсчитайте на большом материале, сколько раз встречается то или иное слово. Запишите затем все частоты слов в список в порядке убывания частот: первым поставьте самое «популярное» слово, вторым — следующее за ним по частоте, и т. д., пока на последнем месте не окажется самое редкое слово. Список занумеруйте. И затем, если вы перемножите частоту слова на номер этого слова в списке (р на s), то получите постоянную величину!

И первое, и десятое слова, и любое другое слово в списке, номер которого будет умножен на частоту этого слова, даст одну и ту же величину! Этот закон приложим к любому языку, любому тексту (за исключением поэтических, как выяснилось позднее).

Чем объясняется эта удивительная особенность нашего языка? Французский ученый Мандельброт объяснил «закон Ципфа» с помощью теории информации, заодно несколько уточнив его. Этот закон «отвечает стремлению к оптимальному распределению информации среди имеющихся в языке слов, с тем чтобы полностью использовать возможности данного кода», — писал он.

ФОРМУЛЫ ГРАММАТИКИ

Если бы Юл принял то определение, какое давал слову Ципф, он, вероятно, пришел бы к открытию этого закона Но, увы! У лингвистов нет точных критериев определения слова. Академик В. В. Виноградов в своей книге «Русский язык», вышедшей в конце 40-х годов, приводил около сорока различных определений, которые давали слову языковеды.

За время, истекшее с тех пор, к старым определениям прибавилось еще множество других: с позиции математической лингвистики, теории информации, теории множеств (например, слово — это минимальный промежуток между двумя пробелами). Попробуйте-ка выбрать подходящую «единицу счета» для составления частотного словаря и других статистических исследований!

Вот почему ученые задумались над тем, чтобы к изучению языка применить не только количественные, но и другие разделы математики. Ибо, по справедливому замечанию французского лингвиста Фердинанда де Сос-сюра, предтечи современного точного языкознания, «до сих пор в области языка довольствовались операциями над единицами, как следует не определенными».

Ольга Сергеевна Кулагина предложила применять математическую теорию множеств для определения грамматических понятий. Это было вызвано практическими причинами: необходимо было дать четкие критерии для машинного перевода. Но из прикладной эта задача вскоре стала на повестку дня языковедов-теоретиков.

Идея Кулагиной породила ряд работ как в математике, так и в лингвистике, посвященных «формулам грамматики», определению законов языка на основании теории множеств.

Специалист по математической логике В. А. Успенский, лингвист И. И. Ревзин, математик Р. Л. Добрушин предложили ряд «математико-грамматических» моделей языка. Академик А. Н. Колмогоров предложил свою математическую модель определения падежа (известный лингвист Р. О. Якобсон считает «определение падежа по Колмогорову» лучшим определением падежа, которое когда-либо было предложено в языкознании).

Возьмем две русские фразы, в каждой из них заменим многоточием какое-либо слово, например:

... кипит.

Кошка пьет ...

Теперь будем подставлять в каждую из фраз вместо многоточия какое-либо слово. Например, слово «молоко». Получим:

Молоко кипит.

Кошка пьет молоко.

Обе фразы осмысленны и грамматически правильны. Поставим теперь вместо многоточий какое-нибудь другое слово. Например, слово «вода». Получим:

Вода кипит.

Кошка пьет вода.

Для слова «молоко» обе фразы с точками равноценны, эквивалентны. И «молоко кипит», и «кошка пьет молоко» — правильные русские предложения. Но для слова «вода» первая фраза с точками подходит, а вторая — нет: «кошка пьет вода» по-русски не говорят. Значит, для слова «вода» фразы с многоточиями — «... кипит» и «кошка пьет ...» — неравноценны, неэквивалентны.

Возьмем теперь не две, а несколько фраз с многоточиями. В каждую из них подставим вместо точек слово «молоко». «... кипит», «кошка пьет ...», «кошка любит ...», «я смотрю на ...», «хорошее ...». Все эти фразы равны друг другу. Равны в том смысле, что в любую из них можно подставить слово «молоко» и получить осмысленную и грамматически верную фразу.

Все множество русских фраз с многоточиями можно разбить на непересекающиеся классы. Эти классы А. Н. Колмогоров и предложил называть падежами.

ЯЗЫК-ПОСРЕДНИК

Придет время, когда в школьных учебниках русского и любого другого языка мира появятся числа и формулы. Законы математики с одинаковым успехом приложимы и к русскому, и к английскому, и к любым другим языкам мира...

А раз так, нельзя ли, опираясь на эти законы, создать некий универсальный язык? Язык, в котором бы нашли отражение закономерности всех живых языков мира?

Поделиться:
Популярные книги

Последний Герой. Том 5

Дамиров Рафаэль
5. Последний герой
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Последний Герой. Том 5

Измена. Свадьба дракона

Белова Екатерина
Любовные романы:
любовно-фантастические романы
эро литература
5.00
рейтинг книги
Измена. Свадьба дракона

Лекарь Империи 3

Карелин Сергей Витальевич
3. Лекарь Империи
Фантастика:
городское фэнтези
аниме
дорама
фэнтези
попаданцы
5.00
рейтинг книги
Лекарь Империи 3

На границе империй. Том 8

INDIGO
12. Фортуна дама переменчивая
Фантастика:
космическая фантастика
попаданцы
5.00
рейтинг книги
На границе империй. Том 8

Кодекс Охотника. Книга XL

Винокуров Юрий
40. Кодекс Охотника
Фантастика:
аниме
фэнтези
попаданцы
5.00
рейтинг книги
Кодекс Охотника. Книга XL

Газлайтер. Том 40

Володин Григорий Григорьевич
40. История Телепата
Фантастика:
альтернативная история
аниме
попаданцы
5.00
рейтинг книги
Газлайтер. Том 40

Родословная. Том 2

Ткачев Андрей Юрьевич
2. Линия крови
Фантастика:
городское фэнтези
аниме
фэнтези
5.00
рейтинг книги
Родословная. Том 2

Бастард Императора. Том 2

Орлов Андрей Юрьевич
2. Бастард Императора
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Бастард Императора. Том 2

Кодекс Крови. Книга ХIII

Борзых М.
13. РОС: Кодекс Крови
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Кодекс Крови. Книга ХIII

Звездная Кровь. Экзарх II

Рокотов Алексей
2. Экзарх
Старинная литература:
прочая старинная литература
5.00
рейтинг книги
Звездная Кровь. Экзарх II

Изгой Проклятого Клана. Том 2

Пламенев Владимир
2. Изгой
Фантастика:
попаданцы
аниме
фэнтези
фантастика: прочее
5.00
рейтинг книги
Изгой Проклятого Клана. Том 2

Он тебя не любит(?)

Тоцка Тала
Любовные романы:
современные любовные романы
7.46
рейтинг книги
Он тебя не любит(?)

Искатель 1

Шиленко Сергей
1. Валинор
Фантастика:
фэнтези
попаданцы
рпг
5.00
рейтинг книги
Искатель 1

Поводырь

Щепетнов Евгений Владимирович
3. Ботаник
Фантастика:
фэнтези
6.17
рейтинг книги
Поводырь