Введение в теоретическую лингвистику - Джон Лайонз
Шрифт:
Интервал:
Закладка:
N = {John, и т. д.}
V = {ran, и т. д.}
А = {poor, и т. д.}
Adv = {away, и т. д.},
приведенная выше грамматика из трех правил будет порождать такие предложения, как Poor John ran away, вместе с их правильной структурой составляющих. Наоборот, имея данное предложение и используя лексикон, организованный более удобным для анализа образом, то есть приблизительно в такой форме, как
away : Adv
John : N
poor : A
ran : V,
мы сможем заменить каждое слово этого предложения символом его класса и затем последовательно обработать его правилами грамматики, пройдя по ним снизу вверх и Справа налево до тех пор, пока, благополучно дойдя до начального символа правила (1), мы тем самым не признаем предложение грамматически приемлемым и обладающим определенной структурой составляющих. Следует подчеркнуть, что возможность выбирать направление последовательного действия правил связана с тем, что данная грамматика удовлетворяет некоторым общим условиям (которые мы здесь не будем рассматривать; ср. § 6.2.11). Независимо от этой частной особенности она нейтральна относительно анализа и синтеза (см. § 4.3.1), и она формализует понятие «размеченной скобочной записи» (см. § 6.1.3).
6.2.3. АЛЬТЕРНАТИВНЫЕ ПРАВИЛА
Теперь расширим эту грамматику так, чтобы сделать ее способной «производить» и «распознавать» не только такие предложения, как Poor John ran away, но и предложения типа Old men love young women 'Старые мужчины любят молодых женщин'. Мы можем сделать это путем введения правил, предусматривающих альтернативные способы «замены» элемента VP (глагольная группа). Таким образом:
(1) Σ → NP + VP
(2а) VP → Vintr + Adv
(2b) VP → Vtr + NP
(3) NP → A + N.
Имеется в виду, что одно из подправил — (2а) или (2b) — должно быть применено обязательно, но выбор между ними произволен. Введя в грамматику возможность выбирать между (2а) и (2b), мы должны также изменить классификацию слов в лексиконе:
Vintr = {ran, и т. д.}
Vtr = {love 'любить', kill 'убить, убивать', и т. д.}.
Тем не менее в целом ряде отношений наша грамматика продолжает оставаться не вполне удовлетворительной. Прежде всего, можно заметить, что, хотя она правильно порождает те предложения, которые мы использовали выше, она также порождает такие неприемлемые «предложения», как *Poor John kill old women [41]. В какой-то момент мы должны будем учесть существующее в английском языке «согласование» между «подлежащим» предложения и глаголом (если глагол стоит в «настоящем времени»). Временно мы оставим этот вопрос в стороне (см. § 6.5.4). Вторым недостатком грамматики является то, что, если каждое из правил применяется всюду, где оно применимо, как мы до сих пор полагали, грамматика будет неизбежно порождать либо предложения из пяти слов типа Old men love young women 'Старые мужчины любят молодых женщин', либо предложения из четырех слов типа Poor John ran away 'Бедный Джон убежал прочь'. Она не породит John ran away 'Джон убежал прочь', John ran 'Джон побежал', Men love young women 'Мужчины любят молодых женщин', Old men love women 'Старые мужчины любят женщин' и т. п. И она не породит, скажем, Old men love young women passionately 'Старые мужчины страстно любят молодых женщин'.
6.2.4. ФАКУЛЬТАТИВНЫЕ И ОБЯЗАТЕЛЬНЫЕ ПРАВИЛА
Разобьем теперь правило (3) на два правила, а именно:
(3) NP → N
(4) N → А + N,
указав, что правило (3) является обязательным, тогда как правило (4) факультативно. Теперь грамматика породит John ran away, Men love women, Old men love women, Men love young women и т. д.
Рассмотрим теперь деревья (приведенные на рис. 10), представляющие предложения, которые порождаются правилами, установленными до сих пор, как, например: (i) John ran away, (ii) Poor John ran away, (iii) Men love women, (iv) Old men love women, (v) Men love young women, (vi) Old men love young women.
Рис. 10. (Отметим, что ветвь для NP → P пропущена в (v) и (vi).)
Обратившись к деревьям или правилам, посредством которых строятся эти предложения, можно видеть, что все рассматриваемые предложения являются подтипами предложения типа Σ (NP + VP). Другими словами, на некотором уровне анализа они структурно тождественны. На более низком уровне (i) и (ii) тождественны друг с другом, но отличны по структуре от (iii) — (iv) и т. д. Введение факультативных и альтернативных правил, таким образом, увеличивает «силу» грамматики, а также группирует однотипные конструкции в соответствующие подтипы.
6.2.5. УПОРЯДОЧЕНИЕ ПРАВИЛ
Все, что было сказано до сих пор, предполагало применение правил грамматики (там, где они применимы) в порядке, соответствующем их номерам. Мы должны рассмотреть этот вопрос подробнее, так как требование того, а не иного порядка применения правил может существенно повлиять на выход грамматики. Рассмотрим следующую систему правил, которая совпадает с приведенной выше, за исключением того, что добавлено новое праеило (4) (правила (4) и (5) представляют собой факультативные правила)'
(1) Σ → NP + VP
(2а) VP → Vintr + Adv
(2b) VP → Vtr + NP
(3) NP → N
(4) N → T + N
(5) N → Adj + N.
Предполагается, что указание T = {the} приводится в прилагаемом словаре. Поскольку правила (4) и (5) факультативны, грамматика породит men, the men, good men и the good men. Ho если бы допускалось применение правила (5) до правила (4), то в качестве грамматически правильных допускались бы такие неприемлемые предложения, как *good the men. Заметим, что существенным является также место правила (3). Если бы оно было помещено перед правилом (2b), его пришлось бы повторить снова после (2b), чтобы обеспечить развертывание тех NP, которые получаются в результате VP → Vtr + NP.
Мы видели, что порядок правил в системах «подстановок» в грамматиках структуры составляющих может быть важным по двум соображениям: он дает возможность избежать порождения неприемлемых последовательностей элементов и позволяет уменьшить число требуемых правил. В определенных случаях при описании грамматической неоднозначности вроде упомянутой выше (см. § 6.1.3) может оказаться желательным допустить, чтобы та или иная группа правил могла применяться в разных порядках. Возьмем, например, факультативное правило, описывающее сочинение существительных в следующей форме:
(6) N → N + and + N.
Если применять это правило перед правилом (5) в данной системе правил, на выходе получатся сочетания типа (old men) and women и men and (old women). Но если оно применяется после правила (5), результатом будут сочетания типа old (men and women). Неоднозначность последовательности old men and women, которая может означать либо (old men) and women, либо old (men and women), можно удовлетворительно описать, таким образом, в терминах различия в относительном порядке употребления правил (5) и (6). Можно заметить, однако, что сочетание со скобками old (men and women), порождаемое посредством применения правила (6) после правила (5), семантически эквивалентно сочетанию (old men) and (old women), которое могло бы быть порождено посредством двукратного применения правила (5) к выходу правила (6).
6.2.6. РЕКУРСИВНЫЕ ПРАВИЛА
Правило координации (сочинения) имен—это правило, которое было бы желательно применять не один только раз, но многократно, собственно говоря, бесчисленное число раз. В самом деле, возможны последовательности, образованные из неограниченно большого числа имен, соединенных посредством and. Может показаться, что наиболее простой способ описания представляет собой введение в грамматику ряда альтернативных правил:
(6а) N → N + and + N
(6b) N → N + and + N + and + N
(6c) N → N + and + N + and + N + and + N
и т. д.
Ясно, однако, что этот способ неудовлетворителен, поскольку не существует верхнего предела числу имен, которые в английском языке могут находиться в сочинительной связи такого рода. Правда, в конкретном тексте или в полном множестве всех когда-либо производившихся высказываний может найтись именная группа (или ряд именных групп), которая будет содержать больше сочиненных имен, чем любая другая именная группа. Можно бы считать весьма незначительной вероятность того, что носитель языка произведет именную группу, которая включала бы число имен, превышающее этот высший предел. Остается тем не менее фактом, что, какое бы число мы ни положили верхним пределом, будет всегда возможно произвести предложение, содержащее именную группу, в которой число составляющих ее имен превысит любой предполагавшийся «верхний предел». Таким образом, поскольку в принципе невозможно перечислить бесконечное множество альтернативных правил, мы можем допустить, чтобы правило (6) применялось неограниченное число раз. Правила, которые могут применяться неограниченное число раз, называются рекурсивными. Весьма вероятно, что во всех языках существует множество конструкций, порождение которых требует рекурсивных правил. Другими примерами из английского языка могут служить сложные предложения (например, Не carne in and he sat down and he said that... and he... (Он пришел, и он сел, и он сказал, что..., и он...') и модификация (определение) существительных прилагательными (например: great big black... dog 'большая рослая черная... собака'). Если мы захотим сделать нашу грамматику более «реалистичной» моделью создания предложений и построить ее таким образом, чтобы она порождала больше примеров рекурсивных структур с двумя составляющими, чем с тремя, больше примеров структур с тремя составляющими, чем с четырьмя, и т. д., мы можем достичь этого, приписав определенную вероятность каждому числу, указывающему, сколько раз следует применять соответствующее правило (вероятности будут порождаться как бесконечный ряд с пределом нуль). Точно таким же образом можно приписать вероятности каждому члену множества альтернативных правил и каждому факультативному правилу нашей грамматики. Но мы ни в коем случае не должны смешивать вероятность появления с грамматической правильностью. Хотя носители языка могут колебаться в отношении приемлемости некоторых частных конструкций с низкой частотностью, представляется, что вообще неверно, чтобы они всегда рассматривали конструкции с высокой вероятностью появления как более приемлемые, чем конструкции с низкой вероятностью появления.