Категории рода и падежа в теоретико-множественных моделях языков | Сочинения, рефераты и доклады по литературе

1. Введение

Математическая лингвистика использует для изучения языков два основных типа моделей: порождающие и аналитические. Несколько упрощая ситуацию, можно сказать, что для порождающих моделей исходным пунктом является некоторая формальная грамматика, а исследуемым объектом - язык, порождаемый этой грамматикой. В аналитических моделях - наоборот: здесь исходным материалом служит язык как совокупность предложений, а цель исследования заключается в том, чтобы выявить структуру этих предложений, их составные элементы, а также отношения между этими элементами.

Порождающие модели используются, в основном, для создания искусственных языков, таких как языки программирования или алгоритмические языки, Для таких языков характерна жесткая структура, простые правила без исключений и, как следствие, ограниченность выразительных возможностей. Многочисленные попытки создать таким образом простой язык для межнационального общения заканчивались неудачей именно в силу изначальной “запрограммированной” ограниченности выразительных средств. При этом анализ языка эсперанто, имеющего наибольший успех и распространение, показывает, что его автор Л.Заменгоф, понимая разрушительную опасность простой, но жесткой грамматики, снабдил язык многочисленными лексическими исключениями (см, напр. [1]).

Аналитические модели в этом смысле более приемлемы для изучения естественных языков. Они не навязывают языку жестких правил, а изучают те законы языка, которые складываются в языке тысячелетиями, имеют исключения и могут со временем изменяться вместе с языком. Понятно, что модель - это лишь некоторое приближение к действительности. Так аналитические модели отображают не весь язык, а лишь некоторые его подмножества, удовлетворяющие данной модели. Именно поэтому приводимые в данной работе примеры часто имеют гипотетический и объяснительный, а не конкретно-языковый характер.

Данная работа посвящена категориям рода и падежа, как наиболее интересным с точки зрения грамматики и имеющим давнюю историю изучения.

2. Языки и грамматики

В дальнейшем нам понадобятся следующие понятия и определения лежащие в основе математической лингвистики.

Назовем конечное множество G словарем. Элементами G будут слова. Рассмотрим множество Т всех конечных последовательностей слов из G . Подмножество Ф правильно построенных последовательностей (предложений) из Т назовем языком над G , а содержащиеся в Ф последовательности будем называть отмеченными последовательностями . Порождающей грамматикой языка Ф называется конечное множество правил, задающее все последовательности из Ф (и только эти последовательности) и сопоставляющее каждой последовательности из Ф описание ее структуры, которое определяет, из каких элементов состоит последовательность (их порядок, иерархию и взаимозависимость), а также содержит другую грамматическую информацию, необходимую для того, чтобы определить, как используется и понимается данная последовательность. Такой подход приводит к порождающим моделям языков. Он тесно связан с теорией формальных систем и другими фундаментальными разделами современной математической логики. В данной работе мы будем придерживаться другой точки зрения на построения модели языка, а именно, точки зрения аналитической грамматики.

Аналитическая грамматика языка Ф исходит из предположения, что язык уже задан, и ставит перед собой цель получить описание последовательностей, принадлежащих множеству последовательностей из Ф “изнутри”, т.е. как описание отношений между словами и подпоследовательностями в зависимости от их позиции в последовательности. Такая точка зрения тесно связана с традицией структурной лингвистики, в особенности с традицией так называемой дискриптивной лингвистики, основы которой заложены в работах [2-6].

Для того, чтобы провести ясное различие между порождающей и аналитической грамматикой, рассмотрим следующий пример. Известно, что язык с конечным числом состояний может быть задан несколькими различными способами. Если используется неоднозначная грамматика, то мы можем обнаружить так называемую структурную омонимию, которая возникает в тех случаях, когда одно и то же предложение имеет как бы несколько различных “конструкций”. Вот например, омонимичное английское предложение [7]: They are flying planes, которое, в сущности, является двумя разными предложениями: 1) They (are (flying planes)) и 2) They ((are flying) planes). Грамматические структуры и смысл обоих этих предложений различны. Это различие может быть установлено с помощью грамматики с конечным числом состояний, допускающей неоднозначности. Такая ситуация является типичной для порождающей грамматики.

Рассмотрим теперь другую ситуацию. Назовем последовательности x и y эквивалентными в Ф , если для каждой пары последовательностей u, v выполняется либо uxv Î Ф, uyv Î Ф, либо uxv Î Т - Ф, uyv Î Т - Ф. Основной результат, полученный в работе [8], а так же теорема Б а р - Х и л л е л а и Ш а- м и р а [7] говорят, что Ф является языком с конечным числом состояний тогда и только тогда, когда в нем существует конечное число классов эквивалентности. Такое определение языков с конечным числом состояний, которое предполагает знание только их внутренней структуры, является основным принципом аналитической грамматики.

Приведенный выше пример показывает не только различие, но также и тесную связь между этими двумя типами грамматик. Каждая из них дополняет описание, задаваемое другой.

3. Парадигматика и дистрибуция

Существует много проблем, относящихся к языку Ф , которые могут успешно изучаться без какого-либо специального уточнения структуры Ф, т.е. только при том предположении, что Ф - определенное подмножество Т над G , и мы можем сказать для каждой последовательности, принадлежит ли она Ф или нет. Однако для исследования проблем грамматического рода и падежа необходимо иметь больше информации о структуре языка. Такую информацию в аналитических моделях обычно несут разбиения.

Разбиением словаря G называется система непустых взаимно не пересекающихся подмножеств G . Обычной лингвистической интерпретацией разбиения G является выделение парадигм, т. е. совокупностей форм одного слова, различающихся флексией . В частности, парадигма слова Buch состоит из форм { Buch, Buchs, B ü cher }, а парадигма gro ß - { gro ß , gr ö ß er, gr ö ß t }.

Строго говоря, парадигмы не образуют разбиения G , поскольку существуют отдельные парадигмы, которые “пересекаются” друг с другом. Однако такие несоответствия модели и действительности неизбежны. Парадигматическое разбиение словаря G будем обозначать буквой P. Через P(x) будем обозначать парадигму слова x Î G , то есть множество слов из G , каждое из которых отличается от x флексией. Двусмысленности не возникнет, так как в каждом конкретном случае будет ясно, какое из обозначений используется.

Другим важным разбиением G , которое нам понадобиться в дальнейшем, является так называемое разбиение на дистрибутивные классы . Оно определяется следующим образом. Два слова a и b принадлежат одному дистрибутивному классу, если для каждой пары последовательностей x, y из xay Î Ф следует xby Î Ф и обратно. Понятие дистрибутивного класса станет интуитивно более понятным, если мы введем понятие контекста. Контекст может быть определен, как упорядоченная пара последовательностей над G . Будем обозначать контекст ( x,y ), где x Î Т и y Î Т . Будем говорить, что слово a допустимо в контексте ( x,y ), если существует такое слово a ¢ Î P(a), что последовательность xa ¢ y принадлежит Ф . Слово a непосредственно допустимо в контексте ( x,y ), если последовательность xay принадлежит Ф . Обозначим через S ( a ) множество всех контекстов, в которых a непосредственно допустимо , через A ( g ) - множество слов, допустимых, а через B ( g ) - множество слов непосредственно допустимых в контексте g = ( x,y ). Отсюда сразу получаем, что два слова a и b принадлежат одному дистрибутивному классу тогда и только тогда, когда S ( a ) = S ( b ), то есть тогда и только тогда, когда a и b непосредственно допустимы в одних и тех же контекстах. Если мы будем интерпретировать G как словарь немецкого языка, а Ф - как множество правильно построенных немецких предложений, то слова Buch и Fenster попадут в один и тот же дистрибутивный класс, тогда как Buch и B ü cher в разные.

Как легко видеть, два различных дистрибутивных класса не пересекаются. Таким образом, эти классы определяют разбиение G , которое мы будем называть дистрибутивным разбиением G и обозначать S . Как и в случае с парадигматическим разбиением будем обозначать через S(a) дистрибутивный класс, содержащий a. Свойства и понятия, определяемые исключительно в терминах дистрибутивных классов и парадигм являются самыми простыми и самыми изящными в лингвистике. Одним из таких понятий является понятие грамматического рода.

4. Грамматический род

Ранее исследовались различные аспекты проблемы грамматического рода такие, как связь между значением существительного и его родом [9], соотношение между родом существительного и его окончанием [10], соответствие рода в плане содержания и в плане выражения [11,12,13], с точки зрения синтаксических и контекстуальных связей [14,15,16], с точки зрения его происхождения и эволюции, т.е. в диахроническом аспекте [17,18,19,20,21,22], наконец проблема рода изучалась синхронически [23,24,25,26,27].

Некоторые из этих вопросов, разумеется, тесно связаны; другие, напротив, решаются независимо. К настоящему времени, почти все авторы сходятся на том, что только семантических критериев явно недостаточно для понимания сложной природы грамматического рода и необходимо использовать все лингвистические факты, относящиеся к этой категории. По этому поводу L. Hjelmslev [28] пишет: “Мы нередко отдаем предпочтение семантическим определениям или определениям через субстанции, которые чаще всего неоднозначны и трудно применимы. Вряд ли можно найти лучший пример этого, чем пример грамматического рода: здесь семантическое определение недостаточно и даже невозможно, и лишь функциональное определение рода как показателя соответствия позволяет получить твердую и надежную точку зрения.” Очевидно, что если мы принимаем, что грамматический род не совпадает с естественным (т.е. с полом), то мы должны признать, что форма, а не значение является решающим фактором в рассматриваемой проблеме.

5. От естественного рода к грамматическому

Попытаемся сначала объяснить (не слишком строго, а в расчете на интуитивное понимание), какова формальная природа соотношения между естественным и грамматическим родом. Это объяснение предваряет построение математических моделей.

Рассмотрим некоторый естественный язык. Возьмем в качестве исходного два существительных x и h , представляющих собой прототип естественного рода (например, man и woman в английском языке). В некоторых языках даже эта операция, столь простая на первый взгляд, требует осторожности: в немецком языке, например, существительное Weib ‘женщина’ не может быть использовано в качестве исходного слова в такого рода построении, поскольку его грамматический род средний. Стоящая перед нами задача заключается в том, чтобы найти такое определение мужского и женского грамматических родов, которое бы в явной форме представило тот механизм, те операции, посредством которых эти категории получены из соответствующих естественных родов. Будем исходить из того, что любое существительное мужского рода должно находиться в строго формальном отношении с существительным x и любое существительное женского рода должно находиться в подобном же отношении с существительным h . Чтобы получить такое отношение используем понятие, введенное Ревзиным [23], а именно, понятие цепи . Это понятие хорошо известно в математической лингвистике. Здесь мы дадим неформальное определение с примерами и комментариями.

Всякое слово входит в два множества: множество словоформ данного слова и множество слов, встречающихся с ним в одних и тех же контекстах. Первое из этих множеств является парадигмой данного слова, второе - его дистрибутивным классом. Например, парадигмой слова Haus является P(Haus) = { Haus, H ä user }, тогда как дистрибутивным классом является S(Haus) = { Haus, Tisch, Buch , ...}. Считается, что словоформы каждого слова заданы и определены однозначно; следовательно, и парадигмы считаются заданными. Что касается дистрибутивных классов, то их состав зависит от того, каково исходное множество предложений. Под предложением было бы желательно понимать всякую грамматически правильную последовательность слов. Однако такое понимание приводит к созданию слишком сложных моделей. Поэтому, если специально не оговаривается противное, то всюду в дальнейшем, при исследовании грамматического рода, под предложением будем понимать дишь синтагмы типа существительное + качественное прилогательное в положительной степени или качественное прилогательное в положительной степени + существительное.

Рассмотрим теперь следующие четыре последовательности латинских слов: (1) dies ‘день’, diem ‘днем’, rem ‘’; (2) lupi ‘волчий’, lupus ’волк’ , urceolorum ‘’, librorum, libros; (3) vir ‘мужчина’, viro ‘’, puero; (4) mulierem, aestatem, aestates, instructiones. Для всех этих последовательностей слов характерно то, что в каждой из них два соседних слова либо входят в одну парадигму (т.е. являются словоформами одного слова), либо принадлежат одному дистрибутивному классу (другими словами встречаются в одних и тех же контекстах). Так, например, lupi и lupus относятся к одной парадигме, urceolorum и librorum относятся к одному дистрибутивному классу и т.д. Такая последовательность слов иллюстрирует понятие цепочки; P является разбиением латинского словаря на парадигмы, а S на семейства. Число элементов в цепи будем называть её длиной. Так цепи (1) и (3) имеют длину 3, цепь (4) длину 4, а цепь (2) - длину 6. Цепи (1), (2), (3) и (4) показывают, что слова dies и rem могут быть соединены цепью длины 3; lupi и libros могут быть соединены цепью длины 6 и т.д.

Использование цепей для определения грамматических родов очень естественно, так как понятие цепи является не чем иным, как объединением двух фундаментальных сторон грамматики - парадигматики и синтагматики. Именно такое объединение и необходимо для теории рода, потому что (говоря неформально) из того, что два существительных относятся к одному и тому же роду, не следует, что они принадлежат к одной и той же парадигме, либо к одному и тому же дистрибутивному классу. И лишь установив взаимосвязь парадигм с дистрибутивными классами, можно решить эту проблему.

Понятия цепи и длины цепи позволяют получить такое определение мужского и женского грамматических родов, которое предполагает переход от естественного рода к грамматическому. Сформулируем сейчас правила, которые являются нестрогими и неформальными, но они позволяют объяснить многие конкретные факты английского, французского, итальянского, испанского, румынского, русского и немецкого языков. Все эти факты будут проинтерпретированы как иллюстрации нижеследующих правил.

Существительное относится к мужскому грамматическому роду, если любая словоформа его парадигмы может быть соединена с любой словоформой парадигмы слова x посредством цепи, длина которой не превышает 3. Из этого непосредственно следует, что и x принадлежит мужскому грамматическому роду.

Существительное относится к женскому грамматическому роду, если любая словоформа его парадигмы может быть соединена с любой словоформой парадигмы слова h посредством цепи, длина которой не превышает 3. Из этого непосредственно следует, что и h принадлежит женскому грамматическому роду.

Существительное относится к среднему роду, если оно не относится ни к женскому ни к мужскому роду.

Существительное относится к общему роду, если оно принадлежит как мужскому, так и женскому роду.

Эти правила характеризуют категорию грамматического рода во многих естественных языках. Считается, что эта категория является невырожденной для существительных данного языка в том случае, когда в этом языке существует по крайней мере одно существительное мужского рода, которое нельзя отнести к женскому роду, и по крайней мере одно существительное женского рода, которое нельзя отнести к мужскому роду.

6. Грамматические категории рода в естественных языках

Проиллюстрируем приведенные выше правила примерами из нескольких естественных языков.

А н г л и й с к и й я з ы к. Форма английского прилагательного зависит только от степени сравнения, в которой оно стоит. Отсюда следует, что если нам даны два английских существительных x ` и x , то существует соединяющая их цепь, длина которой не превышает 3. Действительно, парадигма x содержит некоторое слово x` , которое принадлежит тому же дистрибутивному классу, что и x `; следовательно, мы имеем цепочку x `, x`, x . Например, если x ` = book и x = teachers, то x` = teacher. Если же x принадлежит дистрибутивному классу x `, то мы имеем цепь x `, x ; например, для x ` = book и x = teacher.

Из этого следует, что любое английское слово может быть соединено с man цепью, длина которой не больше 3; то же самое будет верно, если мы заменим слово man на woman. Следовательно, любое английское существительное относится как к мужскому, так и к женскому роду. Таким образом, грамматический род английских существительных является вырожденным.

Ф р а н ц у з с к и й я з ы к. Пусть x = homme, h = femme. Существительные colins, cahier, murs ит.д. относятся к мужскому роду, так как имеются цепи: colins, colin, homme ; colins hommes ; colin, homme, hommes; cahier, homme ; cahiers, hommes, homme ; cahier, homme, hommes ; murs, mur, homme ; murs, hommes ; mur , homme, hommes . Существительные plumes, plue, feuille и другие прнадлежат женскому роду, так как любая словоформа из парадигм этих существительных может быть соединена с любой формой слова femme цепью, длина которой не больше 3; имеются цепи plumes, plume, femme; pluie, femme, femmes; feuille, femme и т. д. Существительные cas, tas, tapis, nez, voix и другие, у которых форма единственного числа совпадает с формой множественного числа, являются существительными среднего рода, так как нет ни одной формы слова homme и ни одной формы слова femme, которые принадлежали бы тому же дистрибутивному классу, что и cas (имеются формы petit cas, petits cas, но нет ни petit hommes, ни petits homme) , так же как не существует никакой формы homme и никакой формы femme, которая принадлежала бы тому же дистрибутивному классу, что и voix (имеются формы belle voix, belles voix, но нет ни belle femmes, ни belles femme ; имеются homme beau, hommes beaux , но нет ни voix beau , ни voix beaux ). Существительные camarade, é lиve, enfant и другие, которым могут предшествовать как прилагательные в форме мужского рода, так и прилагательные в форме женского рода, относятся к среднему роду, так как дистрибутивные классы таких слов не совпадают с дистрибутивными классами ни словоформ homme , ни словоформ femme. Действительно, имеются bon é lиve, bonne é lиve, но нет ни bon femme, ни bonne homme ; имеются bons é lиves, bonnes é lиves , но отсутствуют bons femmes и bonnes hommes.

Итак, во французском языке имеются существительные, которые относятся к мужскому роду и не относятся к женскому ( cahier, mur, soleil и т. д.), а также существительные, которые относятся к женскому роду, но не относятся к мужскому ( plume, pluie, feuille и т. д.); значит, грамматический род французских существительных не является вырожденным.

И т а л ь я н с к и й я з ы к. В качестве прототипов естественнных родов будем рассматривать существительные fratello (для мужского рода) и donna (для женского рода). Существительное frutto - мужского рода, поскольку любая его форма может быть соединена с любой формой слова fratello цепью, длина которой не превышает 3. По той же причине castagno, bordone, giro и т. д. относятся к мужскому роду. Существительное boccola женского рода, потому что любая его форма может быть соединена с любой формой donna цепью, длина которой не больше 3. По той же причине существительными женского рода являются confezione, maremma, roba и т. д. Так как giro представляет собой существительное мужского рода, не будучи существительным женского рода, а roba является существительным женского рода, не будучи существительным мужского рода, грамматический род итальянских существительных не является вырожденным.

Существительные nipote, consorte, giovane, paciente и другие, которым могут предшествовать прилагательные в форме как мужского, так и женского рода , относятся к среднему роду, поскольку ни одна форма fratello и ни одна форма donna не принадлежит дистрибутивному классу такого рода слов. Действительно, имеются buono giovane, buona giovane, но нет ни buono donna, ни buona fratello.

И с п а н с к и й я з ы к. Прототипами естественных родов будем считать существительные padre (для мужского рода) и madre (для женского рода). Существительное libro относится к мужскому роду, так как мы имеем цепи libro, padre; libro, padre, padres; libros, padres; libros, padres, padre. Существительное casa относится к женскому роду, так как имеются цепи casa, madre; casa, casas, madres; casas, madres, madre. Поскольку libro - существительное мужского рода, но не женского, и casa - существительное женского рода, но не мужского, грамматический род испанских существительных не является вырожденным.

Л а т и н с к и й я з ы к. Пусть x = vir ’муж’, ‘мужчина’, h = mulier ‘женщина’. Существительное puer ‘мальчик’ мужского рода, так как любая его форма может быть соединена с любой формой слова vir цепью длины не больше 3. Поскольку и vir, и puer имеют каждое по семь различающихся словоформ, мы получаем 49 цепочек ( puero, puer, vir; pueri, viri, virum; pueros, pueris, viris и т. д.). Существительное aestos ‘ лето ’ женского рода, так как любая его форма может быть соединена с любой формой слова mulier цепью, длина которой не больше 3. Поскольку и aestas, и mulier имеют каждое по 8 различающихся словоформ, мы получаем 64 цепи ( aestas, mulier; aestatis, aestati, mulieri; aestate, muliere, mulieribus и т. д.).

Существительное tempus ‘ время ’ не является ни существительным мужского рода, ни существительным женского рода. Оно относится к среднему роду.

Может показаться, что приведенная классификация согласуется с традиционным разделением латинских существительных по родам. Однако рассмотрим существительное capra ‘ коза ’. Кратчайшая цепь, которая соединяет формы caprae и mulieres , имеет длину 4: caprae, capra, mulier, mulieres. Следовательно, вопреки распространенному представлению и традиционной грамматике capra не является существительным женского рода. Этот пример показывает, что приведенные выше правила не годятся для приписывания латинским существительным их привычных грамматических родов.

Р у м ы н с к и й я з ы к. Пусть x = b ă rbat , h = femeie. Чтобы убедиться в том, что pom ‘дерево’ - существительное мужского рода, мы должны доказать, что любая словоформа из его парадигмы может быть соединена с любой словоформой из парадигмы b ă rbat цепью, длина которой не меньше 3. А так как каждая парадигма содержит семь словоформ, для доказательства требуется построить 49 цепочек. Укажем некоторые из них pom, b ă rbat; pomi, b ă rbati, b ă rbatul; pomule, pomului, b ă rbatului и т. д. Следовательно, pom - это существительное мужского грамматического рода. Подобным же способом можно доказать, что par ‘жест’, copil ‘ребенок’, stilp ‘столб’ и т. д. также относятся к мужскому роду.

Существительное mas ă ‘стол’ относится к женскому грамматическому роду, так как каждая из его словоформ принадлежит к тому же дистрибутивному классу, что и какая-нибудь из форм слова femeie. Можно построить, например, цепи mas ă , mesei, femeii; mesele, femeile, femeilor и т. д.

Pom и femeie не могут быть соединены цепью, длина которой меньше 4, поскольку ни одна словоформа из парадигмы pom не входит в общий дистрибутивный класс с femeie и ни одна словоформа парадигмы femeie не входит в дистрибутивный класс слова pom. Следовательно, pom не относится к женскому роду. Легко показать подобным же способом, что mas ă не может быть соединена с b ă rbat цепью, длина которой меньше 4. Отсюда mas ă не является существительным мужского рода. Таким образом мы показали, что в румынском языке грамматический род существительных не является вырожденным.

Отметим теперь, что сказанное выше справедливо для всякого румынского существительного мужского и женского рода, а значит, румынский язык не имеет существительных обоюдного рода.

Рассмотрим существительное scaun ‘ стул ’ . Оно не относится к мужскому роду, так как scaune и b ă rbati могут быть соединены лишь цепочкой длины 4: scaune, scaun, b ă rbat, b ă rbati. С другой стороны, scaun не является также существительным женского рода, так как scaun и femeie могут быть соединены лишь цепью длины 4: scaun, scaune, femei, femeie. Следовательно, по нашему определению scaun является существительным среднего рода.

Р у с с к и й я з ы к. Пусть x = мужчина и h = женщина. Существительное стол - мужского рода, поскольку всякая форма x’ от слова стол принадлежит дистрибутивному классу какой-нибудь формы слова x . Например, столы принадлежат дистрибутивному классу мужчины и т. д. Книга - слово женского рода, так как любая его форма принадлежит дистрибутивному классу некоторой формы слова h . В русском языке нет существительных, которые одновременно относятся к мужскому и женскому роду, потому что формы прилагательных мужского и женского рода в единственном числе различны. При этом имеются существительные (например, стол ), которые относятся к мужскому, но не к женскому роду, и существительные (например, книга), которые относятся к женскому, но не к мужскому роду.

Существительное окно - не мужского и не женского рода, так как оно не принадлежит ни к дистрибутивному классу какой-либо формы x , ни к дистрибутивному классу какой-либо формы h . Следовательно, окно - существительное среднего рода. Наличие существительных среднего рода в русском языке обусловлено тем, что формы прилагательных, которые используются со словом окно , отличаются от форм прилагательных при x и h .

Н е м е ц к и й я з ы к. Пусть x = Vater и h = Mutter . Существительное Titel ‘заглавие’ - мужского рода, так как имеются следующие цепи: Titel, Vater; Titel, Titels, Vaters; Titel, Titeln, V ä ten; Titel, Vater; V ä ter; Titels, Vaters, Vater; Titels, Vaters, V ä ter; Titels, Vaters, V ä tern; Titeln, V ä tern, Vater; Titeln, V ä tern. Cуществительное Gabel ‘вилка’ женского рода, так как имеются цепочки: Gabel , Mutter; Gabel, Mutter, Muttern; Gabeln, Muttern; Gabeln, Muttern, Mutter. Существительное Fenster ‘окно’ не относится ни к мужскому, ни к женскому роду, следовательно, в немецком языке имеются существительные среднего рода. Рассмотрим, однако, слово Knabe. Оно считается существительным мужского рода. Однако кратчайшая цепь между Knabe и Vater имеет длину 4. Разумеется Knabe и Vater не принадлежат одному дистрибутивному классу, поскольку можно сказать guten Vater , но нельзя сказать guten Knabe (нужно guten Knaben ). Так как Knaben и V ä tern имеют одинаковое распределение ( guten Knaben, guten V ä tern) , то мы получаем цепочку Knabe, Knaben, V ä tern, Knabe,Vater в качестве кратчайшей между Knabe и Vater. Отсюда следует, что наши правила неадекватны для некоторых немецких существительных.

Сформулируем теперь некоторые выводы из рассмотренных правил и примеров.

1. Рассмотренные правила позволяют, вообще говоря, обнаружить грамматический род в английском, французском, итальянском, испанском, румынском, немецком и русском языках. Некоторые незначительные противоречия (например, тот факт, что во французском языке существительные cas, tas, tapis и т. д. были отнесены к среднему роду) связаны с ограниченым запасом контекстов (прилагательное + существительное, существительное + прилагательное). Если соответствующим образом преобразовать исходное множество отмеченных последовательностей, то подобные противоречия исчезнут.

2. Рассмотренные правила не вполне адекватно отражают факты латинского и немецкого языков. Необходимо выработать иные правила, которые позволили бы лучше определять грамматические роды в этих и, возможно других языках.

3. С точки зрения принятой теории, в языке не может быть больше четырех, причем основными родами всегда являются мужской и женский. Но имеются случаи, которые не укладываются в эту схему. Более глубокий анализ какого-нибудь естественного языка может обнаружить так называемае личные роды, причем в некоторых языках противопоставление мужского и женского родов не является основным (например, в шведском языке основными родами являются общий и средний).

4. Приписывание словам грамматических родов не абсолютно однозначно. Оно зависит от определенного выбора парадигм и предложений (отмеченных последовательностей слов). Если мы, например, возьмем только изолированные слова в качестве предложений, то все они образуют единственный дистрибутивный класс, так что, взяв любые два слова, мы можем соединить их цепью, длина которой равна 2. В частности, все существительные будут относиться как к мужскому, так и к женскому роду, и, следовательно, грамматический род будет вырожденным. Это замечание раскрывает синтагматический характер грамматического рода, его существенную зависимость от контекста.

Определенные изменения в выборе парадигм также могут сделать неверными некоторые выводы, полученные выше. Так, например, если под парадигмой румынского существительного scaun мы понимаем всю совокупность его словоформ, стоящих в единственном числе, а под парадигмой слова scaune мы понимаем все его словоформы, стоящие во множественном числе, то scaun относится к мужскому роду, тогда как scaune - к женскому. Действительно, любое из слов scaun, scaunul, scaunului, scaunule можно соединить с любым словом из парадигмы b ă rbat цепью, длина которой не превышает 3, и каждон из слов scaune, scaunelor, scaunele можно соединить с любым словом из парадигмы femeie цепочкой, длина которой не больше 3.

Если преобразовать все парадигмы существительных, которые традиционно относят в румынском языке к обоюдному роду, так как мы это сделали выше с парадигмой слова scaun, т. е. разделить их ра две парадигмы: одну для единственного числа, а другую - для множественного, то в румынском языке обоюдный род перестанет существовать. Этот вывод содержится в работах [29,30].

Другим довольно естественным преобразованием парадигм представляется нам следующее. Объединим парадигмы P(x) и P(y) существительных x и y, которые различаются слообразовательным аффиксом, обозначающим род: во французском языке объединим P(cousin) и P(cousine), P( é poux) c P( é puose), P(loup) с P(louve) и т. д.; в итальянском языке P(eroe) и P(eroina), P(re) с P(regina), P(signore ) c P(signora) и т. д.; в румынском языке P(profesor) с P(profesoar ă ), P(elev) c P(elev ă ) и т. д. Посредством такой операции все вышеуказанные существительные превратятся в существительные общего рода. Если мы рассмотрим, например, французское существительное cousin, то мы увидим, что оно относится к мужскому роду, так как всякое слово из P(homme) находится в том же дистрибутивном классе, что и некоторое слово из P(cousin) . Оно является одновременно и существительным женского рода, так как любая форма слова femme принадлежит тому же дистрибутивному классу, что и некоторая словоформа из прежней парадигмы слова cousine, P(cousine), а следовательно, из новой расширенной парадигмы P(cousin) È P(cousine). Итак, слово cousine имеет общий род. Подобным же образом можно показать, что eroe, re и signore становятся существительными общего рода в итальянском языке, а profesor и elev становятся существительными общего рода в румынском языке.

7. Мера различия между родами

Перейдем теперь к проблеме измерения различий между двумя данными родами. С этой целью введем понятие расстояния между двумя родами G(x) и G(y), которое определяется как наименьшее число n такое, что всякое слово рода G(x) может быть соединено со всяким словом рода G(y) цепью, длина которой не более n + 1. В том случае, когда такого числа не существует, мы будем говорить, что расстояние между G(x) и G(y) бесконечно. Будем обозначать через d (x,y) расстояние между G(x) и G(y). Нетрудно видеть, что d (x,y) ³ 0, d (x,y) = d (y,x), d (x,y) £ d (x,z) + d (z,y) для всякого слова z. Таким образом, для d (x,y) выполняются почти все свойства расстояния в метрическом пространстве. Это понятие особенно удобно, когда множества слов, относящиеся к разным родам, не пересекаются (как в большинстве приведенных выше примеров).

Определим теперь расстояния между родами в различных естественных языках. Не претендуя на полное описание, мы хотим тем самым лишь пояснить на примерах понятие расстояния и его лингвистический смысл.

А н г л и й с к и й я з ы к. Для двух произвольно взятых существительных x и y имеем G(x)= G(y) и d (x,y) = 2.

Ф р а н ц у з с к и й я з ы к. Рассмотрим семь следующих родов: G(crayon) - первый мужской, G(arbre) - второй мужской, G(maison) - женский, G(cas) - первый средний, G(voix) - второй средний, G(enfant) - третий средний, G(camarade) - четвертый средний. Поскольку bel arbre и bels arbres - правильные словосочетания в отличие от bel crayon, bels crayons, то d (crayon,arbre) = ¥ . C другой стороны, так как beau crayon и beaux crayons - правильные словосочетания, а beau maison и beaux maisons таковыми не являются, то d (crayon,maison) = ¥ . Так как словосочетания nouveau cas и nouveaux cas правильные, а nouveau crayon и nouveaux crayons неправильные, то d (crayon,cas) = ¥ . Поскольку beau voix и beaux voix неправильны, то d (crayon,voix) = ¥ . Ввиду того, что правильные словосочетания belle enfant и belles enfants становятся неправильными, если заменить enfant на crayon и enfants на crayons d (crayon,enfant) = ¥ . Поскольку bel arbre, bels arbres правильны, тогда как bel cas, bels cas неправильны, то d (arbre,cas) = ¥ . Так как словосочетания bel voix, bels voix неправильны, то d (arbre,cas) = ¥ . Ввиду того, что belle enfant и belles enfants правильны, тогда как belle arbre и belles arbres правильными не являются, d (arbre,enfant) = ¥ . Поскольку grande voix и grandes voix - правильные словосочетания, а grande maisons grandes maison - нет, то d (maison,voix) = ¥ . Так как bel enfant и bel enfants являются правильными словосочетаниями, тогда как bel maison и bels maisons - нет, то d (maison,enfant) = ¥ . Подобным же образом мы находим, что d (maison,cas) = ¥ , d (voix,cas) = ¥ и d (voix,enfant) = ¥ . Из того, что словосочетания beau camarade, beaux camarades, bell camarade и belles camarades являются правильными, тогда как beaux camarade, beau camarades, belles camarade, belle camarades, bel camarade, bels camarades неправильны, следует, что d (crayon,camarade) = d (arbre,camarade)= d (maison,camarade)= d (camarade,cas)= camarade = d (enfant, camarade) = ¥ , Нетрудно видеть, что два различных рода никогда не пересекаются.

И т а л ь я н с к и й я з ы к. Рассмотрим три следующих рода: G(fratello) - мужской, G(bocolla) - женский, G(giovane) - средний. Так как buono fratello и buoni fratelli - правильные словосочетания, а buono bocolla и buoni bocolle - неправильные, то d (fratello,bocolla) = ¥ . Так как buona giovane и boune giovani допустимы, а buona fratello и buone fratelli - нет, то d (fratello,giovane) = ¥ . Из того, что buono giovane и buoni giovani - правильные словосочетания, в то время как buono bocolla и buoni bocolle неправильные, следует, что d (giovane,bocolla) = ¥ . Легко видеть, что два разных рода никогда не пересекаются.

И с п а н с к и й я з ы к. Рассмотрим роды G(padre) и G(madre). Аналогичными приемами находим, что d (padre,madre) = ¥ .

Р у м ы н с к и й я з ы к. Рассмотрим шесть следующих родов: G(pom) - мужской , G(carte) - женский , G(scaun) - первый средний , G(ochi) - второй средний , G(inv ă t ă toare) - третий средний , G(nume) - четвертый средний.

Кратчайшая цепочка между pomi и carte имеет длину 6: pomi - pom - scaun - scaune - c ă rti - carte. Так как любое слово парадигмы P(pom) можно связать с любым словом парадигмы P(carte) цепью, длина которой не превышает 6, то d (pom,carte) = 5. Кратчайшая цепь между pomi и scaune имеет длину 4: pomi - pom - scaun - scaune.

Так как любое слово парадигмы P(pom) можно соединить с любым словом парадигмы P(scaun) цепью, длина которой не больше 4, то имеем d (pom,scaun) = 3.

Кратчайшая цепь между pom и ochi имеет длину 4: pom - pomului - ochiului - ochi. Так как любое слово из парадигмы P(pom) можно соединить со всяким словом парадигмы P(ochi) цепью, длина которой не превышает 4, то d (pom, ochi) = 3. Кратчайшая цепь между pomi и inv ă t ă toare имеет длину 6: pomi - pom - scaun - scaunelor - inv ă t ă toarelor - inv ă t ă toare. Так как любое слово парадигмы P(pom) может быть соединено с любым словом парадигмы P(inv ă t ă toare) цепью, длина которой не превышает 6, то имеем d (pom,inv ă t ă toare) = 5. Из того, что для любого x Î P(pom) и любого y Î P(nume) имеется цепь x - pomului - numelui - y, следует, что d (pom,nume) = 3.

Для всякого x Î P(carte) и всякого y Î P(scaun) имеется цепь x - c ă rti - scaune - y. Отсюда d (carte,scaun) = 3. Для любого x Î P(carte) и любого y Î P(ochi) имеется цепь x - c ă rti - scaune - scaunului - ochiului - y; отсюда d (carte,ochi) = 5. Для всякого x Î P(carte) и всякого y Î P(inv ă t ă toare) имеется цепь x - c ă rtii - inv ă t ă toarei - y. Отсюда d (carte,inv ă t ă toare) = 3. Для всякого x Î P(carte) и всякого y Î P(nume) существует цепь x - c ă rtilor - numelor - y. Отсюда d (carte,nume) = 3.

Подобным же образом устанавливаем, что d (scaun,ochi) = 3, d (scaun,inv ă t ă toare) = 3, d (scaun,nume) = 3, d (ochi,inv ă t ă toare) = 5, d (ochi,nume) = 3, d (nume,inv ă t ă toare) = 3. Ясно, что два разных рода никогда не пересекаются.

Р у с с к и й я з ы к. Рассмотрим роды G(стол) - мужской, G(книга) - женский и G(окно) - средний. Используем следующее свойство этого языка: форма множественного числа русских прилагательных для всех родов совпадает. Отсюда следует, что формы множественного числа двух существительных, стоящих в одном и том же падеже, относятся к одному и тому же семейству. Если x Î G(стол), y Î G(книга) и z Î G(окно), а x ¢ , y ¢ , z ¢ - соответствующие формы именительного падежа множественного числа, то существуют цепи x - x ¢ - y ¢ - y , x - x ¢ - z ¢ - z, y - y ¢ - z ¢ - z. Следовательно, d (стол,книга) = d (стол,окно) = d (книга,окно) = 3.

Н е м е ц к и й я з ы к. Рассмотрим следующие роды: G(Titel) - мужской, G(Gabel) - женский, G(Fenster) - средний. По тем же причинам, что и в русском языке, оказывается, что d (Titel,Gabel) = d (Gabel,Fenster) = d (Titel,Fenster) = 3.

Л а т и н с к и й я з ы к. Рассмотрим роды G(puer) - мужской, G(aestas) - женский, G(tempus) - средний. Воспользуемся следующими обстоятельствами: форма дательного падежа множественного числа латинских прилагательных совпадает для всех родов. Из этого следует, что формы дательного падежа множественного числа двух существительных принадлежат одному и тому же семейству. Если x Î G(puer), y Î G(aestas), z Î G(tempus), то имеются цепи x - pueris - aestatibus - y, x - pueris - temporibus - z, y - aestatibus - temporibus - z. Отсюда следует, что d (puer,aestas) = d (aestas,tempus) = d (puer,tempus) = 3.

Сделаем выводы по приведенным результатам.

1. Расстояние между мужским и женским родом максимально во французском, итальянском и испанском языках (где оно равно ¥ ) и минимально в русском, немецком и латинском языках (где оно равно 3). Румынский язык в это отношении занимает промежуточное положение.

2. В отличие от русского, немецкого и латинского языков, где три рода в одинаковой степени противопоставлены друг другу, что проявляется в постоянном значении расстояний между ними, в румынском языке некоторые из средних родов занимают явно подчиненное положение по сравнению с мужским и женскими родами. Например, расстояние между мужским и женским родом равно 5, тогда как расстояние между мужским родом и первым средним родом равно 3.

8. Категория падежа

Карегория падежа является более сложной проблемой для изучения чем категория рода. Имеющиеся работы по этой проблеме касались, в основном, уточнения числа семантических признаков падежей и выявления инвариантных дискретных элементов, как правило бинарных. Комбинируя эти элементы, можно получить все значения различных падежей, возможных в данном языке. Эта точка зрения нашла выражение в известных работах [31-33]. Другие аспекты проблемы падежа затронуты в работах [34-37].

Ниже рассматриваются следующие вопросы. Вначале мы рассмотрим математическую модель падежа, основанную на идее В.А.Успенского [38]. Эта модель выдвигает на первый план синтагматический аспект грамматической категории падежа. Поэтому мы не будем пользоваться здесь понятием формы слова и использовать сведения об их морфологической структуре, а ограничимся, как и в случае с грамматическими родами, обращением к контекстам, в которых употребляются эти слова. Падежи, таким образом, будут определены как классы контекстов. С этой целью мы введем некоторое отношение эквивалентности на множестве отмеченных контекстов, и соответствующие классы эквивалентности как раз и будут падежами.

Далее мы рассмотрим идею А.Н.Колмогорова, предложившего определить падеж с точки зрения семантики. Эта идея изложена в работе [38], но как известно из [39], она была сформулирована Колмогоровым еще несколько десятилетий тому назад. Здесь для описания падежа привлекается семантика, поэтому такой способ определения падежа называется определением в плане содержания. Затем мы рассмотрим также предложенный И.И.Ревзиным [23,40] аналог падежа по Колмогорову, относящийся к плану выражения. Так как все перечисленные походы имеют недостатки, мы, следуя [38], представим затем некоторый синтез упомянутых точек зрения. Следует отметить, что падежная система наиболее сложна в славянских языках, поэтому все используемые примеры взяты из русского языка. На примере русского же языка сформулированы выводы по этому разделу.

9. Определение падежа

Как уже было отмечено выше, категория падежа является более сложной, чем категория рода, и для её изучения требуется построение более тонких разбиений, чем просто разбиения на парадигмы и дистрибутивные классы. Действительно, при всем многообразии слов в парадигме, все они одного рода и дистрибуция требуется по существу лишь для того, чтобы отделить формы единственного и множественного числа. В то же время, в каждой парадигме содержатся формы всех падежей, допустимые контексты которых образуют подчас весьма сложные связи. Поэтому для определения падежа ключевым является понятие согласованных контекстов .

Будем говорить, что два контекста g ¢ и g ¢ ¢ согласованы относительно слова a Î G , если существует такое слово a ¢ Î P(a) , что a ¢ непосредственно допустимо и в g ¢ и в g ¢ ¢ .

Далее, два контекста g ¢ и g ¢ ¢ будем называть согласоваными , если для любого слова a Î G , допустимого как в g ¢ так и в g ¢ ¢ , g ¢ и g ¢ ¢ являются согласованными относительно a и существует по меньшей мере одно слово b непосредственно допустимое как в g ¢ так и в g ¢ ¢ . Условие согласованности контекстов g ¢ и g ¢ ¢ можно представить следующим образом: A ( g ¢ ) Ç A ( g ¢ ¢ ) ¹ 0 и для всякого x Î A ( g ¢ ) Ç A ( g ¢ ¢ ) пересечение P(x) Ç B ( g ¢ ) Ç B ( g ¢ ¢ ) непусто.

Наконец, два контекста g ¢ и g ¢ ¢ назовем эквивалентными и будем обозначать это g ¢ » g ¢ ¢ , если существует конечная цепочка контекстов g ¢ = d 1 , ..., d i , d i +1 ,... d n = g ¢ ¢ , такая что для любого 0 < i < n контексты d i , и d i +1 согласованы. Эквивалентные контексты образуют разбиение множества контекстов на классы. Каждый класс эквивалентных контекстов мы будем называть грамматическим падежом .

Рассмотрим несколько примеров из русского языка. Пусть f 1 = q - пустая последовательность f 2 = кипит, g 1 = кошка пьет, g 2 = q , h 1 = кошка любит, h 2 = q .

Слово воду непосредственно допустимо в контекстах ( g 1 , g 2 ) и ( h 1 , h 2 ), так как фразы кошка пьет воду и кошка любит воду принадлежат Ф. Контексты ( f 1 , f 2 ) и ( g 1 , g 2 ) согласованы относительно слова молоко, но не согласованы относительно слова вода , потому что можно сказать вода кипит и кошка пьет воду, но нельзя сказать ни воду кипит, ни кошка пьет вода. Контексты ( мальчик идет, q ) и ( мальчик идет по, q ) не согласованы относительно слова берег. Контексты ( q , строит дом ) и ( дом строится, q ) не согласованы относительно слова рабочий. Контексты c 1 = ( q , бежала ) и c 2 = ( q , бежит ) согласованы. Контексты c 1 и c 3 = ( q , бежал ) эквивалентны, поскольку в цепочке c 1 - c 2 - c 3 согласованы.

Необходимо отметить, однако, некоторое несовершенство модели. Контексты ( я вижу синий, q ) и ( синий, q ) являются согласованными, а значит эквивалентными, хотя с точки зрения традиционной грамматики мы имеем здесь разные падежи. Чтобы обойти эту трудность, В. А. У с п е н с к и й [38] предложил отказаться от контекстов с прилагательными, порядковыми числительными и т. п. К числу недостатков этой модели следует отнести и то, что разные словоформы одного и того же существительного могут быть непосредственно допустимыми в одном контексте. Например, формы газеты и газету непосредственно допустимы в контексте ( не читал, q ), формы кошке и кошку непосредственно допустимы в контексте ( дал, q ). Чтобы избежать этого Успенский в той же работе предлагает ограничить классы рассматриваемых контекстов таким образом, чтобы две различные словоформы одного и того же слова не могли быть непосредственно допустимыми в одном контексте. Можно показать, однако, что и это усовершенствование не снимает всех трудностей и необходима новая модель.

10. Падеж в смысле Колмогорова

Подход Колмогорова к определению падежа основывается на уверенности в том, что только формальных, то есть синтаксических, средств для определения падежа недостаточно. Необходимо привлечение семантики. Поэтому наряду с языковыми средствами Колмогоров вводит понятия объекта и его состояния.

Пусть K - некоторое множество объектов, а M - множество состояний. Через j обозначим отображение множества K в множество подмножеств M. Обозначим, кроме того, через Z множество всех упорядоченных пар вида { x,t }, где x Î K и t Î j ( x ). Рассмотрим теперь некоторое отображение f множества Z на множество G . Приведем несколько примеров, иллюстрирующих введенные понятия.

Рассмотрим объект молоко. Он может иметь следующие состояния: оно может кипеть, оно может отсутствовать, его может выпить кошка и т. д. Обозначим x = молоко ; s 1 = возможность кипеть, s 2 = возможность отсутствовать, s 3 = возможность быть выпитым кошкой, s 4 = возможность быть выпитым собакой и т. п. Отображение j задается так, что s 1 Î j ( x ), s 2 Î j ( x ), s 3 Î j ( x ), s 4 Î j ( x ) и т.д. Далее, f ({ x , s 1 }) = молоко ( молоко кипит ), f ({ x , s 2 }) = молока ( молока нет ), f ({ x , s 3 }) = молоко ( кошка пьет молоко ), f ({ x , s 4 }) = молоко ( собака пьет молоко ).

Введем теперь новое отношение на множестве состояний M. Будем говорить, что два состояния s 1 и s 2 конгруэнтны, есди выполняются следующие три условия:

1) если s 1 Î j ( x ), то s 2 Î j ( x );

2) если s 2 Î j ( x ), то s 1 Î j ( x );

3) если x - это объект, для которого s 1 Î j ( x ) и s 2 Î j ( x ), то f ( z 1 ) = f ( z 2 ), где z 1 = { x , s 1 } и z 2 = { x , s 2 }.

Введенное отношение разбивает множество состояний M на непересекающиеся классы, которые будем называть семантическими падежами или падежами в смысле Колмогорова.

Семантические падежи хорошо работают при исследовании модельных т. е. искуственных конструкций. При анализе же естественных языков использование семантических падежей связано с некоторыми трудностями, вызванными по большей части слишком широким характером обычных парадигм, т. е. специфическими свойствами множеств P ( u ), где u Î G , и явлением синонимии.

В частности, если для всякого существительного u P ( u ) содержит множество его словоформ, причем не учитываются различия по числу и по определенности-неопределенности (при условии, что последнее выражается в данном языке с помощью артикля), то при попытке применить описанную модель к естественным языкам мы сталкиваемся с определенными трудностями, когда одному состоянию объекта может соответствовать несколько форм слова, обозначающего данный объект. Напрмер, в предложениях мальчик идет берегом и мальчик идет по берегу формы берегом и по берегу выражают одно и то же состояние объекта берег, в предложениях рабочий строит дом и дом строится рабочими формы рабочими и рабочий выражают одно и то же состояние объекта, обозначаемого словом рабочий.

Эти примеры приводят к выводу, что отображение f множества Z на множество G в естественных языках не однозначно. Такого положения можно избежать, приняв следующие меры предосторожности:

(а) выбирать возможно более мелкие разбиения на парадигмы P , считая, например, что имеется отличный от x объект y , состояние которого выражается словоформами множественного числа, а также отличный как от x, так и от y объект z , состояния которого выражаются словоформами единственного числа с неопределенным артиклем;

(б) принять соглашение, исключающее абсолютную синонимию; из него следовало бы, что две отличные друг от друга формы одного и того же слова не могут выражать в точности одно и то же состояние; так, например, предложение мальчик идет берегом выражает другой оттенок значения (иное состояние объекта), обозначенного словом берег, по сравнению с предложением мальчик идет по берегу.

Условия, предложенные в пунктах (а) и (б) вполне приемлимы с точки зрения лингвистики. Если говорить о пункте (б), то многие авторы считают, что в языке не существует полных синонимов. Что касается пункта (а), то он предполагает просто, что анализ категрий числа и определенности-неопределенности закончен, и мы рассматриваем существительные этих категорий по отдельности.

11. Аналог падежа по Колмогорову в плане выражения

И.И.Ревзин [23] предложил следующий аналог падежа по Колмогорову в плане выражения, ужесточающий выбор контекстов для определения падежа. Два контекста ( f 1 ,f 2 ) и ( g 1 ,g 2 ) назовем эквивалентными относительно слова x, если x допустимо как в контексте ( f 1 ,f 2 ), так и в контексте ( g 1 ,g 2 ). Таким образом, обозначив через q пустую последовательность и приняв f 1 = q , f 2 = кипит , g 1 = кошка пьет, g 2 = q , x = молоко , получим, что контексты ( f 1 ,f 2 ) и ( g 1 ,g 2 ) эквивалентны относительно x , но не эквивалентны относительно y = вода. Будем говорить, что контексты ( f 1 ,f 2 ) и ( g 1 ,g 2 ) эквивалентны , если они эквивалентны относительно всякого слова, непосредственно допустимого по меньшей мере в одном из двух рассматриваемых контекстов. Множество контекстов в этом случае разбивается на непересекающиеся множества, которые мы и будем называть падежами в смысле Ревзина.

Тем не менее и при таком определении падежа остаются языковые ситуации, в которых понятие падежа по Ревзину противоречит языковой интуиции. В работе [40] сам Ревзин отмечает, по отношению к славянским языкам его модель не дает желаемых результатов. Возьмем, например, контексты: 1) ( мальчик читает хорошую, q ), 2) ( мальчик читает хороший, q ), 3) ( мальчик читает, q ). Контексты 1) и 2) не эквивалентны относительно слова рассказ, контексты 2) и 3) не эквивалентны относительно слова книгу. Тогда по определению мы здесь имеем три разных падежа, что противоречит правилам русского языка.

Имеются и другие примеры. Например, контексты ( q , читает книгу ) и ( q , читают книгу ) по-прежнему принадлежат разным падежам, поскольку глагол имеет разные формы в единственном и множественном числе. Контекст ( два, q ) не принадлежит никакому падежу, так как последовательность два мальчика не попадает ни в один класс эквивалентности (ни одна из форм слова девочка не допускается в этом контексте) и невозможно сказать, в каком падеже допустимо слово мальчик. Вот почему Ревзин предлагает в [40] рассматривать не все множество отмеченных последовательностей, а только множество контекстов, индуцированных диагностическим множеством.

12. Диагностическое множество

Для определения диагностического множества нам понадобится еще одно разбиение множества слов G , которое будем называть типом языка. Будем говорить, что два слова x и y принадлежат одному типу T , если

1) для всякой отмеченной последовательности fxg , существует такая отмеченная последовательность f ¢ y ¢ g ¢ , что f ¢ Î P(f) , g ¢ Î P(g) , y ¢ Î P(y) ,

2) для всякой отмеченной последовательности uyv , существует такая отмеченная последовательность u ¢ x ¢ v ¢ , что u ¢ Î P(u) , v ¢ Î P(v) , x ¢ Î P(x) .

Множество слов, принадлежащих тому же типу, что слово x образует тип слова x и обозначается T(x).

Будем говорить, что контекст ( f 1 ,f 2 ) индуцирован последовательностью g , если существует такое слово x, что g = f 1 xf 2 , то есть, если этот контекст получен исключением слова x из последовательности g.

Отмеченная последовательность является диагностической, если всякий контекст, индуцированный g и допускающий слово x , допускает также всякое слово y Î T(x) . Множество диагностических последовательностей D назовем диагностическим .

Если теперь рассмотреть приведенный выше пример контекстов: 1) ( мальчик читает хорошую, q ), 2) ( мальчик читает хороший, q ), 3) ( мальчик читает, q ), становится ясно, что только третий из контекстов принадлежит множеству контекстов индуцированных диагностическим множеством. Контекст 1) не принадлежит этому множеству, поскольку слово рассказ принадлежит тому же типу, что и слово книга, тогда как его формы недопустимы в данном контексте. Аналогично, контекст 2) так же не принадлежит этому множеству. Напротив, контекст 3) допускает слова книгу, рассказ, повесть, упражнение и т. п. То есть этот контекст определяет падеж (винительный) и всякое слово, принадлежащее тому же семейству, что и слово книгу (например, тарелку ), естественно допустимо в этом падеже.

13. Адекватные контексты

В своей монографии [41] Маркус делает попытку объединить синтаксическмй и семантический подходы в построении модели для определения категории падежа. Для этого он использует объединяющие понятие адекватного контекста.

Пусть, как и прежде, K - некоторое множество объектов, M - множество состояний, а j - отображение множества K во множество подмножеств M. Введем отображение w множества объектов K во множество слов G и построим отображение m такое, что для каждого s Î j ( x ), найдется m ( x , s ) Í Ф .

Рассмотрим состояние t Î M и контекст c = ( x,y ). Будем говорить, что c адекватен t , если для всякого объекта k Î K такого, что t Î M ( k ), выполняется следующее условие: существует такое слово a Î P ( w ( k )), что m ( k , t ) = xay.

Поясним введенные определения. Отображение w сопоставляет каждому объекту (единице плана содержания) определенное слово (единицу плана выражения). Отображение m сопоставляет каждому состоянию s объекта k последовательности, которые показывают, что объект k находится в состоянии s. То, что контекст c = ( x,y ) адекватен состоянию t , означает, что для всякого объекта, который может принимать состояние t , существует такая флективная форма слова a , обозначающего этот объект, что последовательность xay выражает состояние t рассматриваемого объекта. Напрмер, если состояние t некоторого объекта соответствует тому, что указанный объект строит дом, то любой из русских контекстов ( q , строит дом ) и ( дом строится , q ) адекватен состоянию t. Если же состояние означает, что кто-то не читал рассматриваемого объекта, то контекст ( не читал , q ) адекватен t. На этом примере мы убеждаемся, что форма слова в приведенном определении в общем случае не определена однозначно. Действительно, если речь идет об объекте k таком, что w ( k ) = a = газета, то можно принять, что a = газету , но также a = газеты . Действительно, как последовательность не читал газету, так и последовательность не читал газеты выражает то, что объект находится в состоянии t. Другой пример: контекст ( дал, q ) адекватен состоянию, которое заключается в том, что кто-то дал какую-то вещь определенному объекту. Тот жеконтекст адекватен состоянию, которое заключается в том, что кто-то дал кому-то определенный объект.

14. Адекватные пары и двузначные падежи

Если определено состояние t Î M и контекст с адекватен t , будем говорить, что { t , с } - адекватная пара . Всякий объект k , который может принимать состояние t , то есть такой, что t Î M ( k ), является по определению объектом, допустимым относительно пары { t , с }. Две адекватные пары { t 1 , с 1 }и { t 2 , с 2 } ( с 1 = ( x 1 , y 1 ), с 2 = ( x 2 , y 2 )) по определению согласованы относительно объекта k , если для всякой формы a Î P ( w ( k )) выполняются два следующих условия:

1) если x 1 ay 1 Î m ( k , t 1 ), то x 2 ay 2 Î m ( k , t 2 ),

2) если x 2 ay 2 Î m ( k , t 2 ), то x 1 ay 1 Î m ( k , t 1 ).

Две адекватные пары являются согласованными , если существует некоторый объект, допустимый относительно каждой из этих пар, и обе пары согласованы относительно любого объекта, допустимого относительно каждой из этих пар.

Две адекватные пары { t , с } и { t ¢ , с ¢ } являются конгруэнтными , если существует конечная последовательность адекватных пар { t 1 , с 1 }, { t 2 , с 2 },...,{ t n , с n }, обладающая следующими свойствами: { t , с } = { t 1 , с 1 }; { t n , с n } = { t ¢ , с ¢ }; для всякого 1 £ i £ n - 1 пары { t i , с i }{ t i+ 1 , с i +1 } являются согласованными.

Легко видеть, что отношение конгруэнтности - это отношение эквивалентности на множестве адекватных пар. Соответствующие классы эквивалентности являются по определению двузначными падежами рассматриваемого падежа. Эта концепция падежной системы касается одновременно и плана выражения и плана содержания. Таким образом, она выдержана в духе теории Фердинанда де Соссюра.

Чтобы определить двузначный падеж некоторого существительного в определенном контексте с = ( x,y ), нужно сначала определить, каково существующее состояние объекта k , слово w ( k ), которого совпадает с u. Это такое состояние t, что m ( k , t ) = xuy (здесь может сказаться явление омонимии; может существовать несколько одинаково обозначенных объектов, поэтому следовало бы предположить, что отображение w однозначно, т. е. омонимии нет). Далее проверяем, является ли пара { t , с } адекватной. Класс конгруэнтности, содержащий эту пару, представляет собой двузначный падеж существительного u в контексте с.

Чтобы применить этот метод к формам множественного числа, достаточно принять, что объект, выражаемый существительным в форме единственного числа, отличен от объекта, выражаемого тем же существительным в форме множественного числа.

Использование этого подхода приводит Успенского [38] к выводу о том, что в русском языке, кроме имеющихся шести традиционных падежей имеются еще несколько двузначных. Например, местный падеж ( в лесу, в году и т. д.) и падеж с количественным значением ( выпить чаю, прибавить жару, дать воды и т. д.)

Если оба выражения не читал газеты и не читал газету считать правильными и выражающими одно и то же состояние объекта, обозначаемого словом газета, то существует отложительный падеж (родительный отложительный), употребляемый после глаголов с отрицанием. Этот падеж может принимать две формы - винительного и родительного падежа. Если последовательность не читал газету правильна, тогда как последовательность не читал газеты признается неправильной, то газету в первом случае стоит в винительном падеже. Если последовательность не читал газеты правильна, тогда как последовательность не читал газету такой не признается, то слово газеты в первой последовательности стоит в родительном падеже. Наконец, если обе последовательности правильны, но выражают разные состояния объекта, обозначаемого словом газета, то газету стоит в винительном, тогда как газеты в родительном падеже.

Литература

1. Б о к а р е в Е. А. Эсперанто-русский словарь, Москва, Изд. “Русский язык”, 1982.

2. B l o o m f i e l d L., A set of postulates for the science of language, Language 2 (1926), 26-31.

3. Б л у м ф и л д Л., Язык, “Прогресс”, 1968.

4. H a r r i s Z. S., Structural Linguistics, Chicago, Univ. Chicago Press, 1961.

5. H o c k e t t C. F., A Course in Modern Linguistics, N.Y., 1958.

6. W e l l s R. S., Immediate constituents, Language 23 (1947), 81-117.

7. B a r - H i l l e l Y., S h a m i r E., Finite state languages: formal representation and adequacy problems, in Y. Bar-Hillel “Language and Information. Selected Essays on Their Theory and Application”, Addison-Wesley, Reading, Mass., 1964, 87-98.

8. Р а б и н М. О., С к о т т Д., Конечные автоматы и задачи их разрешения, Кибернетический сборник, вып. 4, ИЛ, 1962, 58-91.

9. L o h m a n n J., Genus und Sexus, G ö ttingen, 1960.

10. М е л ь ч у к И. А. Статистика и зависимость рода французских существительных от окончания, сб. “Вопросы статистики речи”, Л., 1978, 112-130.

11. J a k o b s o n R., Zur Struktur des russischen Verbums, in “Charisteria G. Mathesio... oblata”, Prague, 1932, 74-79.

12. Е л ь м с л е в Л., О категориях личности-неличности и одушевленности-неодушевленности, в сб. “Материалы к спецкурсу по структурной топологии языков” (сост. О.Г.Ревзина), МГУ, Лаборатория структурной типологии и лингвостатистики, 1975, 68-126.

13. V a s i l i u E., Observatii asupra categoriei genului î n limba rom â n ă , Studii Cercet ă ra Lingvistice 11, № 3 (1990), 463-464.

14. D i a c o n e s c u P., Le nombre et le genre du substatif roumain (Analyse contextuelle), Rev. Roumaine Linguistique 9, № 2 (1994), 171-193.

15. З а л и з н я к А. А., Категория рода одушевленности в русском языке, Вопросы языкознания, 1964, № 1, 25-40.

16. К а р п и н с к а я О. Г., Типология рода в славянских языках, Вопросы языкознания, 1961, № 6, 61-76.

17. G r a u r A., Contributions á l’ é tude du genre personnel en roumain, Bull. Linguistique 13 (1985), 97-105.

18. G r a u r A., Studii de lingvistic ă general ă , Editura Academiei R. P. R., Bucure ş ti, 1980.

19. R o s e t t i A., Despre genul neutrul ş genul personal î n limba rom â n ă , Studii Cercet ă ri Lingvistice 8 (1987), 407-413.

20. R o s e t t i A., Remarques sur la cat é gorie du genre en roumain, Studia Lingvistica 13 (1989), 133-136.

21. R o s e t t i A., Contributii la studiul neutrului î n limba rom â n ă , Studii Cercet ă ri Lingvistice 14, № 4 (1993), 433-438.

22. F o d o r I., The origin of grammatical gender, Lingua 8, № 1-2 (1989).

23. Р е в з и н И. И., Модели языка, Изд. АН СССР, 1962.

24. Р е в з и н И. И., Некоторые вопросы теории моделей языка, сб. “Научно-техническая информация” , 1964, № 8, 42-46.

25. Р е в з и н И. И., Отмеченные цепочки, алгебра фрагментов, категории, сб. “Научно-техническая информация” , 1966, № 12, 37-41.

26. М а р к у с С., Грамматический род и его логическая модель, сб. “Математическая лингвистика”, “Мир”, 1984, 122-144.

27. М а р к у с С., Логический аспект лингвистических оппозиций, сб. “Проблемы структурной лингвистики”, Изд. АН СССР, 1983, 47-74.

28. H j e l m s l e v L., Essais linguistiques, Trav. Cercle lingustique Copenhague 12 (1979), 142-143.

29. B u j o r I. I., Genul substantiivelor in limba rom â n ă , Limba Rom â n ă 4 (1975), 51- 64.

30. Г а б и н с к и й М. А., Автохтонные элементы в молдавском языке, Вопросы языкознания, 1986, № 1, 85-93.

31. H j e l m s l e v L., La cat é gorie des cas, Acta Jutlandica 7, № 1 (1935)

32. Я к о б с о н Р., К вопросу всеобщей теории падежей. Общее значение русских падежей, сб. “Материалы к спецкурсу по структурной типологии языков” (сост. Ревзина О.Г.), МГУ, Лаборатория структурной типологии и лингвистики, 1985.

33. Ш а у м я н С. К., Лингвистические проблемы кибернетики и структурная лингвистика, Вопросы философии, 1980, № 9, 120-131.

34. F r e i H., Cas et dиses en fran ç ais, Cahiers F. de Saussure 12 (1984), 29-47.

35. G o d e l R., Remarques sur des systиmes de cas, Cahiers F. de Saussure 13 (1985), 34-39.

36. К у р и л о в и ч Е., Проблема классификации падежей, сб. “Очерки по лингвистике”, ИЛ,1992.

37. П а д у ч е в а Е. В., Об описании падежной системы русского существительного, Вопросы языкознания, 1990, № 5, 104-111.

38. У с п е н с к и й В. А. К определению падежа по А. Н. Коломогорову, Бюллетень Объединения по проблемам машинного перевода, 1987, № 5, 11-18.

39. Я н о в с к а я С. А., Математическая логика и основания математики, сб. “Математика в СССР за 40 лет, 1917-1957”, т. 1, Физматгиз, 1959.

40. R e v z i n I. I. Note sur un modиle pour la cat é gorie grammatical du cas, in “Omagui lui A. Rosetti la 70 de ani”, Editura Academiei R. P. R., Bucure ş ti, 1965.

41. Маркус С., Теоретико-множественные модели языков, Москва, Изд “Наука”, 1990.

42. У с п е н с к и й В. А., К определению падежа по А. Н. Колмогорову, Бюллетень Объединения по проблемам машинного перевода, 1987, № 5, 11-18.