Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Работа над словарем нераспознанных лексем

РефератПомощь в написанииУзнать стоимостьмоей работы

В 1965 году Дмитрий Дмитриевич окончил Строевскую среднюю школу в Устьянском районе и начал работать трактористом в местном совхозе. После службы в армии в 1968 году был выдвинут на комсомольскую работу на должность заведующим орготделом Устьянского райкома ВЛКСМ. В 1970 году начал обучение в Вологодскую совпартшколе, получил диплом с отличием по специальности «экономист-организатор… Читать ещё >

Работа над словарем нераспознанных лексем (реферат, курсовая, диплом, контрольная)

Результатом работы (Калашникова 2016) стал словарь нераспознанных лексем устьянского корпуса http://pushkinodict.pe.hu/uncategorized.html. Работа над ним происходила в несколько этапов так, что из всего списка нераспознанных корпусом лексем остались только слова, отмеченные как «диалектные» и «диалектные формы». В конечном словаре осталось 1786 вхождения, включая формы, которые прописывались отдельно. Уникальных лексем 1153. В словаре приведены толкования из «Устьянского народного словаря», созданного местными краеведами, и «Архангельского областного словаря» (АОС), созданного кафедрой русского языка филологического факультета МГУ. Так как АОС на момент работы существовал только в 15 томах, толкования из него приводились только для слов до буквы «З». Для 753 лексем не было толкований ни в одном из двух словарей, поэтому приходилось устанавливать значения этих слов исходя из контекстов. Но не для всех лексем значение в контексте было эксплицитно. Такие слова были помечены в словаре вопросительным знаком. Для некоторых вхождений толкования были не совсем точными, так как установить абсолютно точное значение для каждого слова было невозможно. Такие случаи в словаре тоже были отмечены.

Задача совершенствования словаря нераспознанных лексем состояла в том, чтобы исправить существующие толкования, предложенные автором дипломной работы, на более точные. Сделать это, основываясь только на контекстах, было невозможно. Поэтому была организована поездка в поселок Октябрьский Архангельской области (апрель 2017 года), где была возможность побеседовать с одним из редакторов «Устьянского народного словаря» Дмитрием Дмитриевичем Пушкиным Автор работы выражает глубокую благодарность Д. Д. Пушкину, а также А. А. Истомину и В. П. Мамонову за оказанную помощь в обновлении толкований для словаря.. Несмотря на то, что данные для корпуса записывались в деревнях Устьянского района, поездка в деревню не требовалась для уточнения толкований слов, так как Дмитрий Дмитриевич имеет обширные знания диалекта и был способен объяснить нужные слова.

Д.Д. Пушкин родился в 1946 году в небольшой (из трех домов) деревушке Мурашово в Устьянском районе Архангельской области. Практически все время, за исключением 2,5 лет службы в армии и 2 лет очной учебы в Вологде, проживал в Устьянском районе, поэтому знает практически все населенные пункты, жизнь, быт, традиции и особенности местного диалекта.

В 1965 году Дмитрий Дмитриевич окончил Строевскую среднюю школу в Устьянском районе и начал работать трактористом в местном совхозе. После службы в армии в 1968 году был выдвинут на комсомольскую работу на должность заведующим орготделом Устьянского райкома ВЛКСМ. В 1970 году начал обучение в Вологодскую совпартшколе, получил диплом с отличием по специальности «экономист-организатор сельскохозяйственного производства». В 1972 году был избран штатным секретарем партийного комитета совхоза «Орловский», где проработал 11 лет. В этот период окончил с отличием Заочную Высшую партийную школу при ЦК КПСС. В 1983 году был переведен на работу в Устьянский райком КПСС в посёлок Октябрьский, работал инструктором орготдела, затем инструктором сельхозотдела, а с 1985 года — заведующим сектором партучета райкома партии. В 1991;2000 гг. был старшим экономистом, заместителем директора филиала Росгосстраха в Устьянском районе. В 2000;2005 гг. работал председателем комитета по защите прав потребителей администрации муниципального образования «Устьянский район». С 2013 года сотрудничает с Устьянским краеведческим музеем и редакторской группой по составлению «Устьянского народного словаря» .

Дмитрий Дмитриевич предоставил автору данной работы обновленную версию «Устьянского народного словаря», в которую были добавлены 2899 слов. Это значительно упростило работу над словами, так как некоторые из них уже были добавлены в «Устьянский народный словарь», требовалось лишь добавить эти толкования в словарь нераспознанных лексем.

Перед поездкой были подготовлены два списка слов в виде таблиц в Microsoft Excel. В первый список вошли слова, толкований для которых не было вообще, или слова с неточными значениями. В этот список вошли 226 слов. Второй список включал в себя оставшиеся слова, для которых значение устанавливалось на основе контекста, но для большей уверенности в правильности их можно было уточнить. Этот список состоит из 527 слов. Работа с Дмитрием Дмитриевичем происходила в два этапа: сначала внимательно рассматривался первый список слов, а затем второй, но не так углубленно, так как значения были достаточно точными. Каждое слово из первого списка просматривались в корпусе, но даже несмотря на наличие контекстов, для некоторых слов всё ещё было затруднительно установить толкование. Таких слов было 37 и в дальнейшем они были собраны в отдельный файл с приведенными контекстами, для дальнейшего обсуждения с остальными редакторами Устьянского словаря. Примечательно, что все эти слова в корпусе помечались треугольными скобками, что свидетельствует о том, что слово могло быть неправильно затранскрибировано (либо плохое качество записи, и слова просто не слышно, либо расшифровщик текста был не уверен в том, что он услышал). В этот список вошли следующие лексемы: вдуть, вила, выгоразить, гряной, делок, едава, забубны, заворошить, закумный, знацевать, золовья, колуга, молодить, набудовать, натураситься, овочпункт, побонить, подвалка, полгруда, привсказаться, прокупь, пупыркать, пыхлый, пяленый, россвоить, сетурч, смеить, снашивать, стерплить, ступер, теплушка, толдом, угоренка, ухруваться, черня, шпар, якаток.

Но, тем не менее, редакторами словаря А. А. Истоминым, В. П. Мамоновым, совместно с Д. Д. Пушкиным, впоследствии была предпринята попытка объяснить эти слова. Для некоторых слов были предложены варианты исправления, когда авторы считали, что слово записано неправильно, но по контексту подходит другое, употребляющееся в диалекте, слово. Все уточненные толкования были добавлены в словарь и помечены, чтобы было понятно, кто предложил то или иное толкование.

Среди оставшихся слов 45 имели те или иные толкования в «Устьянском народном словаре», хотя и не были включены в словарь нераспознанных лексем. Это произошло в силу двух причин:

  • 1. Слова относились к новым статьям, которых не было в той версии словаря, которая использовалась при создании словаря нераспознанных лексем;
  • 2. Не всегда было понятно, к какой словарной статье относится то или иное слово. И в данном случае, именно то, что Д. Д. Пушкин является одним из редакторов «Устьянского народного словаря» сыграло огромную роль, так как он мог подсказать, где следует искать определенное слово. К таким словам относились лексемы взверескивать, выпархивать, вязочка, грестись, дерёвко, дильно, домовище, задолить, заклади, запаливать, засбоить, зафуки, зачалить, инье, лишки, льнище, молодуха, мороковать, наодаться, наробленный, наспускать, нять, опушеный, орушник, парюш, паствица, пахнучий, повоз, поддегрёбок, полонья, поманить, постилальник, поутов, поцанки, пошоркать, приворотить, прожихровать, прядино, пушеный, рясот, скрапать, треплить, черень, чернь, шалять, этака.

Для 103 слов какое-то подобие толкований имелось, но они были совершенно неточные, требовавшие исправления. Толкования 39 слов были одобрены Д. Д. Пушкиным, остальные же исправлялись. Среди одобренных были толкования следующих лексем: бороть, бурашек, заварник, заварничек, избуреть, криплен, лишко, лытяный, мел, наболтить, навозьм, неработник, облеваться, обтерепенькать, партейцы, патраки, повсесть, понаслышке, поплощить, поробленный, посолить, потиптопывать, пустош, разбегать, растакой, растоперить, решёто, скрепать, страмный, суземый, тончива, тятька, уголенка, церковный, чёго, чимерица, шестера.

Работа над вторым списком слов проходила быстрее, контексты рассматривались только для сложных случаев. В основном, толкования были одобрены Д. Д. Пушкиным и оставлены без изменений, но для 45 лексем были предложены уточнения для того, чтобы определения были более полными. Это лексемы голавль, детко, икаться, исачить, корет, кострик, набруснить, насбираться, насымать, невершенный, нежитый, неимачий, нинабудь, обжигать, одонок, онучка, отечь, отсмотреть, пекариха, перед, пестик, побегаться, поверать, подти, поинтересовать, полсадовника, поскрёбыш, прясница, пялина, разэтовать, раскрежевать, распархивать, ременник, роститься, сволочь, скать, сновальня, тамба, туесье, тюды, тюрюк, упружиться, шизякнуться, штормовщина, яз. Все уточнения так же были добавлены в словарь. В ходе работы над списками слов было принято решение добавить в словарь ссылки на полные контексты для всех имеющихся примеров. Это было сделано из-за того, что исходя из примеров, приведенных в словаре, было сложно понять, о чем идет речь. С ссылками на контексты пользователь может сразу же получить доступ к более полному тексту для понимания употребления того или иного слова. Кроме того, в процессе добавления гиперссылок на контексты было обнаружено, что некоторые слова уже не находятся в корпусе (либо они были исправлены и их нужно искать по другому запросу, либо произошла техническая ошибка). В таких случаях вхождение с данным словом удалялось из словаря.

В конце работы над словарем был изменен интерфейс сайта, где данный словарь находится. Это было сделано для того, чтобы впоследствии был более удобный доступ как к словарю нераспознанных лексем, так и к грамматическому словарю. Была создана главная страница, с которой можно перейти к обоим словарям, добавлено описание проекта, и сам сайт переименован в «Словари на основе Устьянского звукового корпуса» http://pushkinodict.pe.hu/index.html .

Показать весь текст
Заполнить форму текущей работой