Цифровая Грамотность ДЗ Филологи — различия между версиями
Haniani (обсуждение | вклад) (→💻 Домашнее задание 2) |
Haniani (обсуждение | вклад) |
||
| Строка 99: | Строка 99: | ||
+1 балл за разметку всех отрывков из первой части задания | +1 балл за разметку всех отрывков из первой части задания | ||
| + | |||
| + | == 💻 Домашнее задание 3 == | ||
| + | |||
| + | '''Дедлайн:''' Мягкий дедлайн - 3 апреля, жесткий дедлайн - 7 апреля 23.59. | ||
| + | |||
| + | '''Важно:''' После дедлайна работы не принимаются. | ||
| + | |||
| + | Задание состоит из трёх частей. | ||
| + | |||
| + | '''1. AntConc''' | ||
| + | |||
| + | 1. Создайте txt с вашим текстом (полное произведение), лемматизируйте его с помощью Mystem (презентация 8). Формат текста - UTF-8, проверить можно в любом текстовом редакторе (Sublime Text, NotePad++) ''(1 балл)'' | ||
| + | |||
| + | 2. Откройте его в AntConc, посмотрите самые частотные слова (Word List). | ||
| + | |||
| + | 3. Добавьте список стоп-слов (см. презентацию). | ||
| + | |||
| + | 4. Кликнув на 3 устаревших слова, посмотрите их конкордансы. ''(2 балл)'' | ||
| + | |||
| + | 5. Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. ''(1 балл)'' | ||
| + | |||
| + | 6. Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. ''(1 балл)'' | ||
| + | |||
| + | 7. Приложите скриншоты выполнения заданий 4-6 | ||
| + | |||
| + | '''2. Google Ngrams и НКРЯ''' | ||
| + | |||
| + | 1. Изучите фрагмент вашего текста, выделите устаревшие слова. | ||
| + | |||
| + | 2. Сравните их употребление с современными аналогами в Google Ngrams и НКРЯ. Сделайте выводы. ''(2 балла)'' | ||
| + | |||
| + | 3. Посчитайте ipm для каждого слова по основному корпусу в НКРЯ. ''(1 балл)'' | ||
| + | |||
| + | '''3. Использование инструментов корпусного анализа в профессиональной деятельности.''' | ||
| + | |||
| + | 1. Как исследование корпуса помогло вам в понимании текста, что нового вы узнали, оказались ли для вас полезными в решении конкретной задачи и не только изученные инструменты? ''(2 балла)'' | ||
Текущая версия на 18:38, 18 марта 2019
💻 Домашнее задание 1
Дедлайн: Мягкий дедлайн - 5 февраля, жесткий дедлайн - 7 февраля 23.59.
Важно: После дедлайна работы не принимаются.
Для выполнения задания воспользуйтесь:
1) Текстовым редактором Sublime Text или NotePad++
2) Выберите один из вариантов выполнения:
а) конструктором сайтов (WIX или Tilda, ссылку на свой сайт после публикации необходимо разместить в README.md, где мы работали с Markdown)
б) CSS фреймворком Bootstrap (инструкция по подключению к GitHub Pages находится в презентации в комментариях докладчика).
в) самостоятельно с использованием html + css
Суть задания: Необходимо создать сайт, на котором будет помещена следующая информация:
1. Заголовок (1 балл)
2. Данные об исследователе: ваши фио, место учебы, научные интересы, немного о себе. (2 балл)
3. Прикрепить фото к биографии и картинку к тексту. (2 балла)
4. Текстовый раздел с коротким текстом (3-5 предложений) на тему "Как современные технологии могут помочь филологу" (2 балла)
5. Текстовый раздел с коротким анализом достоинств и недостатков сайтов из списка (презентация семинара 3, слайд 15), либо любого специализированного сайта на ваш выбор + скриншот и ссылка на ресурс. (3 балла)
Бонусная часть:
+2 балла за вариант выполнения задания "самостоятельно с использованием html + css"
💻 Домашнее задание 2
Дедлайн: Мягкий дедлайн - 26 февраля, жесткий дедлайн - 3 марта 23.59.
Важно: После дедлайна работы не принимаются.
0. Для выполнения задания воспользуйтесь текстовым редактором NotePad++ или Sublime Text (можно любой другой на ваш выбор для Mac OS).
Файлы с отрывками сохраняйте в формате .txt .
Размеченные отрывки выкладываем на Github в репозиторий HW2.
1. Выполните разметку прямой речи любого отрывка из этого списка. (5 баллов)
О тегах можно прочитать тут: https://github.com/DanilSko/speech/wiki
Образец: https://docs.google.com/presentation/d/1qKQOF2ZvSW-iSQN7z0xFh4D_NTTVLpAyUzFYSQKRzpM/edit#slide=id.g4e2f895de0_0_11 (слайд 12)
Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (слайд 6 и образец):
<TEI> #объявляем tei
<teiHeader> #информация об источнике
<fileDesc>
<titleStmt>
<title>Название книги</title>
</titleStmt>
<respStmt>
<persName>Иван Петров</persName>
<resp>Что делал с документов (создание TEI документа, выделение в тексте прямой речи/ персоналий/мест)</resp>
</respStmt>
</fileDesc>
<profileDesc> # задаем список персонажей
<particDesc>
<listPerson type="historical"> # тип персонажа исторический, художественнный...(класс можно придумать самостоятельно)
<person xml:id="01"> # айди - буквы, цифры, названия - на ваш выбор
<persName>Маша</persName> # выделяем персонажа
</person>
<person xml:id="02">
<persName>Иван</persName>
</person>
</listPerson>
</particDesc>
</profileDesc>
</teiHeader>
<text> #работа с самим текстом
Текст текст текст <speech>-Какая-то прямая речь</speech> Текст текст текст <speech>-Какая-то прямая речь</speech>
</text>
</TEI>
2. Выполните разметку фрагмента (назначенный вам текст и фрагмент по этой ссылке), выделив персоналии (c помощью <persName> для обозначения персоналии) и места (<placeName>). (5 баллов)
Текст текст текст <person xml:id="01"><persName>имя</persName></person> текст текст
Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (см. образец).
Подробнее о том, как оформляются персоналии и места, можно узнать тут: http://tei.it.ox.ac.uk/Talks/2015-03-lyon/talk-2-3-entities.xml
Бонусная часть:
+1 балл за разметку всех отрывков из первой части задания
💻 Домашнее задание 3
Дедлайн: Мягкий дедлайн - 3 апреля, жесткий дедлайн - 7 апреля 23.59.
Важно: После дедлайна работы не принимаются.
Задание состоит из трёх частей.
1. AntConc
1. Создайте txt с вашим текстом (полное произведение), лемматизируйте его с помощью Mystem (презентация 8). Формат текста - UTF-8, проверить можно в любом текстовом редакторе (Sublime Text, NotePad++) (1 балл)
2. Откройте его в AntConc, посмотрите самые частотные слова (Word List).
3. Добавьте список стоп-слов (см. презентацию).
4. Кликнув на 3 устаревших слова, посмотрите их конкордансы. (2 балл)
5. Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. (1 балл)
6. Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. (1 балл)
7. Приложите скриншоты выполнения заданий 4-6
2. Google Ngrams и НКРЯ
1. Изучите фрагмент вашего текста, выделите устаревшие слова.
2. Сравните их употребление с современными аналогами в Google Ngrams и НКРЯ. Сделайте выводы. (2 балла)
3. Посчитайте ipm для каждого слова по основному корпусу в НКРЯ. (1 балл)
3. Использование инструментов корпусного анализа в профессиональной деятельности.
1. Как исследование корпуса помогло вам в понимании текста, что нового вы узнали, оказались ли для вас полезными в решении конкретной задачи и не только изученные инструменты? (2 балла)