bookmate game
ru
Books
Михаил Копотев

Введение в корпусную лингвистику

  • ibelyalovhas quoted6 years ago
    исходя из особенностей обработки таких единиц, их можно разделить на три группы:
    1. Контактные неомонимичные обороты
    К этой группе относятся единицы, в которых компоненты непосредственно располагаются друг за другом и однозначно образуют цельную единицу: составные числительные («тридцать три», «33»), единицы типа «потому что», «несмотря на».
    2. Контактные омонимичные обороты
    Эту, самую многочисленную, группу образуют единицы с контактным расположением компонентов, но омонимичные сочетанию двух (или более) слов, связанных синтаксически или даже не имеющих непосредственной синтаксической связи: в общем (ср. в общем вагоне), в прошлом (ср. в прошлом году) и т. д.
    3. Дистантные обороты (англ. skipgrams / concgrams)
    В эту группу входят единицы, компоненты которых располагаются (или могут располагаться) дистантно: читал бы, если … то.
  • Marina Ilyinykhhas quoted8 years ago
    Согласно данным Частотного словаря русского языка, изданного в 1977 году, в сотню самых частых слов входят существительное «товарищ» и прилагательное «советский».
  • ngomeniukhas quoted3 years ago
    примером полного корпуса
  • ngomeniukhas quoted3 years ago
    представительную, или репрезентативную, выборку (англ. representative sampling) — такой объем материала, увеличение которого уже почти никак не повлияет на распределение единиц
  • ngomeniukhas quoted3 years ago
    разметки, или аннотации
  • ngomeniukhas quoted3 years ago
    Необходимость работать с собственным корпусом (англ. DIY-corpus, do-it-yourself corpus) возникает по разным причинам: исследование языка конкретного автора или жанра, собранный в экспедициях собственный материал и т. д.
  • ngomeniukhas quoted3 years ago
    какой степени можно опираться на корпус
  • ngomeniukhas quoted3 years ago
    первом значении более технологична и предполагает совместную работу лингвистов и специалистов по компьютерным технологиям. Это не столько теоретическое направление лингвистики, сколько технология. Корпусная лингвистика во втором значении — дело лингвистов, в том числе и специалистов по статистической обработке языка
  • ngomeniukhas quoted3 years ago
    Корпусная лингвистика — это лингвистика корпусов, то есть собраний текстов
  • ngomeniukhas quoted3 years ago
    Рембрандта «Урок анатомии доктора Тульпа»,
fb2epub
Drag & drop your files (not more than 5 at once)