ru %D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC %D0%9A%D0%BE%D0%BA%D0%B0 %E2%80%94 %D0%AF%D0%BD%D0%B3%D0%B5%D1%80%D0%B0 %E2%80%94 %D0%9A%D0%B0%D1%81%D0%B0%D0%BC%D0%B8

Алгоритм Кока — Янгера — Касами (англ. Cocke — Younger — Kasami algorithm), алгоритм CYK либо CKY — алгоритм, позволяющий установить, можно ли в заданной контекстно-свободной грамматике вывести заданную строку, и если это так, то предоставить её вывод. Другими словами, это алгоритм синтаксического анализа строки. Алгоритм реализует синтаксический анализ снизу-вверх и основывается на методе динамического программирования. его открыватели: Джон Кок, Дэниел Янгер, Тадао Касами и Джейкоб Т. Шварц. Они использовали восходящий анализ и динамическое программирование.

Стандартная версия CYK работает только с контекстно-свободными грамматиками, заданными в нормальной форме (CNF). Однако любая контекстно-свободная грамматика может быть преобразована (после конвертирования) в грамматику CNF, выражающую тот же язык (Sipser 1997).

Является одним из самых эффективных алгоритмов синтаксического анализа с точки зрения асимптотической сложности в наихудшем случае, хотя существуют и другие алгоритмы с лучшим средним временем выполнения во многих практических сценариях^[1].

Описание

Алгоритм работает следующим образом: на первом шаге записывается слово в первой строке и добавляется каждый нетерминальный символ в строку, под которой выводятся терминальные символы. После этого для каждой ячейки в сетке вертикально сверху вниз необходимо пройти к проверяемой ячейке, а вторая ячейка вверх по диагонали. Для каждого такого шага объединяются ячейки и проверяются на нахождение комбинации в грамматике. При условии нахождения, добавляется левый нетерминал в ячейку сетки. Если после всех шагов начальный символ содержится в последней строке, слово может быть получено по заданной грамматике^[2].

Алгоритм динамического программирования требует, чтобы контекстно-свободная грамматика была преобразована в нормальную форму Хомского (CNF), потому что он проверяет возможность разбить текущую последовательность на две меньшие последовательности. Любая контекстно-свободная грамматика, не порождающая пустую строку, может быть представлена в CNF с использованием продукционных правил^[3].

Псевдокод

На псевдокоде алгоритм выглядит следующим образом:

Алгоритм CYK:
дано строка S из n символов: a₁ ... a_n.
дано грамматика, содержащая r нетерминальных символов R₁ ... R_r.
    Содержит подмножество R_s начальных символов.
опр массив P[n,n,r] булевских значений, инициализированных значениями Ложь.
для каждого i = 1 : n
  для каждой продукции R_j -> a_i
    присвоить P[1,i,j] = Истина
для каждого i = 2 : n                     -- длина интервала
  для каждого j = 1 : n-i+1               -- начало интервала
    для каждого k = 1 : i-1               -- разбиение интервала
      для каждой продукции R_A -> R_B R_C
        если P[k,j,B] и P[i-k,j+k,C]
        то присвоить P[i,j,A] = Истина
если для некоторого x из множества s P[n,1,x] = Истина, где s все индексы R_s
то возвратить S принадлежит языку
иначе возвратить S не принадлежит языку

См. также

Алгоритм Эрли

Примечания

↑ John E. Hopcroft. Introduction to automata theory, languages, and computation. — Reading, Mass.: Addison-Wesley, 1979. — x, 418 pages с. — ISBN 0-201-02988-X, 978-0-201-02988-8.
↑ The CYK Algorithm • Computer Science and Machine Learning (неопр.). www.xarg.org. Дата обращения: 4 октября 2022. Архивировано 4 октября 2022 года.
↑ Michael Sipser. Introduction to the theory of computation. — 2nd ed. — Boston: Thomson Course Technology, 2006. — xix, 431 pages с. — ISBN 0-534-95097-3, 978-0-534-95097-2.

Литература

Younger, Daniel H. Recognition and parsing of context-free languages in time n³ (англ.) // Information and Computation. — Vol. 10, no. 2. — P. 189–208. — doi:10.1016/s0019-9958(67)80007-x.
Knuth, Donald E. The Art of Computer Programming Volume 2: Seminumerical Algorithms. — 3rd. — Addison-Wesley Professional. — 501 p. — ISBN 0-201-89684-2.

Lange, Martin, Leiß, Hans. To CNF or not to CNF? An Efficient Yet Presentable Version of the CYK Algorithm (англ.) // Informatica Didactica. — 2009. — Vol. 8. Архивировано 29 ноября 2014 года.
Sipser, Michael. Introduction to the Theory of Computation. — 1st. — IPS, 1997. — ISBN 0-534-94728-X.
Lee, Lillian. Fast context-free grammar parsing requires fast Boolean matrix multiplication (англ.) // Journal of the ACM. — 2002. — Vol. 49, no. 1. — P. 1–15. — doi:10.1145/505241.505242.
Valiant, Leslie G. General context-free recognition in less than cubic time (англ.) // Journal of Computer and System Sciences. — 1975. — Vol. 10, no. 2. — P. 308–314. — doi:10.1016/s0022-0000(75)80046-8.
Lang, Bernard. Recognition can be harder than parsing (англ.) // Computational Intelligence (journal). — 1994. — Vol. 10, no. 4. — P. 486–494.

[1] John E. Hopcroft. Introduction to automata theory, languages, and computation. — Reading, Mass.: Addison-Wesley, 1979. — x, 418 pages с. — ISBN 0-201-02988-X, 978-0-201-02988-8.

[2] The CYK Algorithm • Computer Science and Machine Learning (неопр.). www.xarg.org. Дата обращения: 4 октября 2022. Архивировано 4 октября 2022 года.

[3] Michael Sipser. Introduction to the theory of computation. — 2nd ed. — Boston: Thomson Course Technology, 2006. — xix, 431 pages с. — ISBN 0-534-95097-3, 978-0-534-95097-2.

[1]

[2]

[3]

Алгоритм Кока — Янгера — Касами

Содержание

Описание

Псевдокод

См. также

Примечания

Литература

Portal di Ensiklopedia Dunia