Цифровая Грамотность ДЗ Филологи — различия между версиями
(→💻 Домашнее задание 2) |
Haniani (обсуждение | вклад) |
||
(не показаны 3 промежуточные версии 2 участников) | |||
Строка 39: | Строка 39: | ||
== 💻 Домашнее задание 2 == | == 💻 Домашнее задание 2 == | ||
− | '''Дедлайн:''' Мягкий дедлайн - 26 февраля, жесткий дедлайн - | + | '''Дедлайн:''' Мягкий дедлайн - 26 февраля, жесткий дедлайн - 3 марта 23.59. |
'''Важно:''' После дедлайна работы не принимаются. | '''Важно:''' После дедлайна работы не принимаются. | ||
Строка 70: | Строка 70: | ||
</respStmt> | </respStmt> | ||
</fileDesc> | </fileDesc> | ||
+ | <profileDesc> # задаем список персонажей | ||
+ | <particDesc> | ||
+ | <listPerson type="historical"> # тип персонажа исторический, художественнный...(класс можно придумать самостоятельно) | ||
+ | <person xml:id="01"> # айди - буквы, цифры, названия - на ваш выбор | ||
+ | <persName>Маша</persName> # выделяем персонажа | ||
+ | </person> | ||
+ | <person xml:id="02"> | ||
+ | <persName>Иван</persName> | ||
+ | </person> | ||
+ | </listPerson> | ||
+ | </particDesc> | ||
+ | </profileDesc> | ||
</teiHeader> | </teiHeader> | ||
<text> #работа с самим текстом | <text> #работа с самим текстом | ||
Строка 77: | Строка 89: | ||
2. Выполните разметку фрагмента (назначенный вам текст и фрагмент [https://docs.google.com/spreadsheets/d/1khSFOs4wlN7hwafi0x9xbPurA6HhdR_klv4sZ2Y8bUQ/edit?usp=sharing по этой ссылке]), выделив персоналии (c помощью <persName> для обозначения персоналии) и места (<placeName>). (5 баллов) | 2. Выполните разметку фрагмента (назначенный вам текст и фрагмент [https://docs.google.com/spreadsheets/d/1khSFOs4wlN7hwafi0x9xbPurA6HhdR_klv4sZ2Y8bUQ/edit?usp=sharing по этой ссылке]), выделив персоналии (c помощью <persName> для обозначения персоналии) и места (<placeName>). (5 баллов) | ||
+ | |||
+ | Текст текст текст <person xml:id="01"><persName>имя</persName></person> текст текст | ||
Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (см. образец). | Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (см. образец). | ||
Подробнее о том, как оформляются персоналии и места, можно узнать тут: http://tei.it.ox.ac.uk/Talks/2015-03-lyon/talk-2-3-entities.xml | Подробнее о том, как оформляются персоналии и места, можно узнать тут: http://tei.it.ox.ac.uk/Talks/2015-03-lyon/talk-2-3-entities.xml | ||
+ | |||
+ | '''Бонусная часть:''' | ||
+ | |||
+ | +1 балл за разметку всех отрывков из первой части задания | ||
+ | |||
+ | == 💻 Домашнее задание 3 == | ||
+ | |||
+ | '''Дедлайн:''' Мягкий дедлайн - 3 апреля, жесткий дедлайн - 7 апреля 23.59. | ||
+ | |||
+ | '''Важно:''' После дедлайна работы не принимаются. | ||
+ | |||
+ | Задание состоит из трёх частей. | ||
+ | |||
+ | '''1. AntConc''' | ||
+ | |||
+ | 1. Создайте txt с вашим текстом (полное произведение), лемматизируйте его с помощью Mystem (презентация 8). Формат текста - UTF-8, проверить можно в любом текстовом редакторе (Sublime Text, NotePad++) ''(1 балл)'' | ||
+ | |||
+ | 2. Откройте его в AntConc, посмотрите самые частотные слова (Word List). | ||
+ | |||
+ | 3. Добавьте список стоп-слов (см. презентацию). | ||
+ | |||
+ | 4. Кликнув на 3 устаревших слова, посмотрите их конкордансы. ''(2 балл)'' | ||
+ | |||
+ | 5. Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. ''(1 балл)'' | ||
+ | |||
+ | 6. Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. ''(1 балл)'' | ||
+ | |||
+ | 7. Приложите скриншоты выполнения заданий 4-6 | ||
+ | |||
+ | '''2. Google Ngrams и НКРЯ''' | ||
+ | |||
+ | 1. Изучите фрагмент вашего текста, выделите устаревшие слова. | ||
+ | |||
+ | 2. Сравните их употребление с современными аналогами в Google Ngrams и НКРЯ. Сделайте выводы. ''(2 балла)'' | ||
+ | |||
+ | 3. Посчитайте ipm для каждого слова по основному корпусу в НКРЯ. ''(1 балл)'' | ||
+ | |||
+ | '''3. Использование инструментов корпусного анализа в профессиональной деятельности.''' | ||
+ | |||
+ | 1. Как исследование корпуса помогло вам в понимании текста, что нового вы узнали, оказались ли для вас полезными в решении конкретной задачи и не только изученные инструменты? ''(2 балла)'' |
Текущая версия на 18:38, 18 марта 2019
💻 Домашнее задание 1
Дедлайн: Мягкий дедлайн - 5 февраля, жесткий дедлайн - 7 февраля 23.59.
Важно: После дедлайна работы не принимаются.
Для выполнения задания воспользуйтесь:
1) Текстовым редактором Sublime Text или NotePad++
2) Выберите один из вариантов выполнения:
а) конструктором сайтов (WIX или Tilda, ссылку на свой сайт после публикации необходимо разместить в README.md, где мы работали с Markdown)
б) CSS фреймворком Bootstrap (инструкция по подключению к GitHub Pages находится в презентации в комментариях докладчика).
в) самостоятельно с использованием html + css
Суть задания: Необходимо создать сайт, на котором будет помещена следующая информация:
1. Заголовок (1 балл)
2. Данные об исследователе: ваши фио, место учебы, научные интересы, немного о себе. (2 балл)
3. Прикрепить фото к биографии и картинку к тексту. (2 балла)
4. Текстовый раздел с коротким текстом (3-5 предложений) на тему "Как современные технологии могут помочь филологу" (2 балла)
5. Текстовый раздел с коротким анализом достоинств и недостатков сайтов из списка (презентация семинара 3, слайд 15), либо любого специализированного сайта на ваш выбор + скриншот и ссылка на ресурс. (3 балла)
Бонусная часть:
+2 балла за вариант выполнения задания "самостоятельно с использованием html + css"
💻 Домашнее задание 2
Дедлайн: Мягкий дедлайн - 26 февраля, жесткий дедлайн - 3 марта 23.59.
Важно: После дедлайна работы не принимаются.
0. Для выполнения задания воспользуйтесь текстовым редактором NotePad++ или Sublime Text (можно любой другой на ваш выбор для Mac OS).
Файлы с отрывками сохраняйте в формате .txt .
Размеченные отрывки выкладываем на Github в репозиторий HW2.
1. Выполните разметку прямой речи любого отрывка из этого списка. (5 баллов)
О тегах можно прочитать тут: https://github.com/DanilSko/speech/wiki
Образец: https://docs.google.com/presentation/d/1qKQOF2ZvSW-iSQN7z0xFh4D_NTTVLpAyUzFYSQKRzpM/edit#slide=id.g4e2f895de0_0_11 (слайд 12)
Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (слайд 6 и образец):
<TEI> #объявляем tei <teiHeader> #информация об источнике <fileDesc> <titleStmt> <title>Название книги</title> </titleStmt> <respStmt> <persName>Иван Петров</persName> <resp>Что делал с документов (создание TEI документа, выделение в тексте прямой речи/ персоналий/мест)</resp> </respStmt> </fileDesc> <profileDesc> # задаем список персонажей <particDesc> <listPerson type="historical"> # тип персонажа исторический, художественнный...(класс можно придумать самостоятельно) <person xml:id="01"> # айди - буквы, цифры, названия - на ваш выбор <persName>Маша</persName> # выделяем персонажа </person> <person xml:id="02"> <persName>Иван</persName> </person> </listPerson> </particDesc> </profileDesc> </teiHeader> <text> #работа с самим текстом Текст текст текст <speech>-Какая-то прямая речь</speech> Текст текст текст <speech>-Какая-то прямая речь</speech> </text> </TEI>
2. Выполните разметку фрагмента (назначенный вам текст и фрагмент по этой ссылке), выделив персоналии (c помощью <persName> для обозначения персоналии) и места (<placeName>). (5 баллов)
Текст текст текст <person xml:id="01"><persName>имя</persName></person> текст текст
Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (см. образец).
Подробнее о том, как оформляются персоналии и места, можно узнать тут: http://tei.it.ox.ac.uk/Talks/2015-03-lyon/talk-2-3-entities.xml
Бонусная часть:
+1 балл за разметку всех отрывков из первой части задания
💻 Домашнее задание 3
Дедлайн: Мягкий дедлайн - 3 апреля, жесткий дедлайн - 7 апреля 23.59.
Важно: После дедлайна работы не принимаются.
Задание состоит из трёх частей.
1. AntConc
1. Создайте txt с вашим текстом (полное произведение), лемматизируйте его с помощью Mystem (презентация 8). Формат текста - UTF-8, проверить можно в любом текстовом редакторе (Sublime Text, NotePad++) (1 балл)
2. Откройте его в AntConc, посмотрите самые частотные слова (Word List).
3. Добавьте список стоп-слов (см. презентацию).
4. Кликнув на 3 устаревших слова, посмотрите их конкордансы. (2 балл)
5. Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. (1 балл)
6. Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. (1 балл)
7. Приложите скриншоты выполнения заданий 4-6
2. Google Ngrams и НКРЯ
1. Изучите фрагмент вашего текста, выделите устаревшие слова.
2. Сравните их употребление с современными аналогами в Google Ngrams и НКРЯ. Сделайте выводы. (2 балла)
3. Посчитайте ipm для каждого слова по основному корпусу в НКРЯ. (1 балл)
3. Использование инструментов корпусного анализа в профессиональной деятельности.
1. Как исследование корпуса помогло вам в понимании текста, что нового вы узнали, оказались ли для вас полезными в решении конкретной задачи и не только изученные инструменты? (2 балла)