Цифровая Грамотность ДЗ Филологи — различия между версиями

Текущая версия на 18:38, 18 марта 2019

💻 Домашнее задание 1

Дедлайн: Мягкий дедлайн - 5 февраля, жесткий дедлайн - 7 февраля 23.59.

Важно: После дедлайна работы не принимаются.

Для выполнения задания воспользуйтесь:

1) Текстовым редактором Sublime Text или NotePad++

2) Выберите один из вариантов выполнения:

а) конструктором сайтов (WIX или Tilda, ссылку на свой сайт после публикации необходимо разместить в README.md, где мы работали с Markdown)

б) CSS фреймворком Bootstrap (инструкция по подключению к GitHub Pages находится в презентации в комментариях докладчика).

в) самостоятельно с использованием html + css

Суть задания: Необходимо создать сайт, на котором будет помещена следующая информация:

1. Заголовок (1 балл)

2. Данные об исследователе: ваши фио, место учебы, научные интересы, немного о себе. (2 балл)

3. Прикрепить фото к биографии и картинку к тексту. (2 балла)

4. Текстовый раздел с коротким текстом (3-5 предложений) на тему "Как современные технологии могут помочь филологу" (2 балла)

5. Текстовый раздел с коротким анализом достоинств и недостатков сайтов из списка (презентация семинара 3, слайд 15), либо любого специализированного сайта на ваш выбор + скриншот и ссылка на ресурс. (3 балла)

Бонусная часть:

+2 балла за вариант выполнения задания "самостоятельно с использованием html + css"

💻 Домашнее задание 2

Дедлайн: Мягкий дедлайн - 26 февраля, жесткий дедлайн - 3 марта 23.59.

Важно: После дедлайна работы не принимаются.

0. Для выполнения задания воспользуйтесь текстовым редактором NotePad++ или Sublime Text (можно любой другой на ваш выбор для Mac OS).

Файлы с отрывками сохраняйте в формате .txt .

Размеченные отрывки выкладываем на Github в репозиторий HW2.

1. Выполните разметку прямой речи любого отрывка из этого списка. (5 баллов)

О тегах можно прочитать тут: https://github.com/DanilSko/speech/wiki

Образец: https://docs.google.com/presentation/d/1qKQOF2ZvSW-iSQN7z0xFh4D_NTTVLpAyUzFYSQKRzpM/edit#slide=id.g4e2f895de0_0_11 (слайд 12)

Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (слайд 6 и образец):

<TEI> #объявляем tei
    <teiHeader>  #информация об источнике
        <fileDesc>
            <titleStmt>
               <title>Название книги</title>
            </titleStmt>
            <respStmt>
                <persName>Иван Петров</persName>
                <resp>Что делал с документов (создание TEI документа, выделение в тексте прямой речи/ персоналий/мест)</resp>
            </respStmt>
         </fileDesc>
         <profileDesc>      # задаем список персонажей
             <particDesc>
                 <listPerson type="historical">   # тип персонажа исторический, художественнный...(класс можно придумать самостоятельно)
                     <person xml:id="01">     # айди - буквы, цифры, названия - на ваш выбор
                         <persName>Маша</persName> # выделяем персонажа
                     </person>
                     <person xml:id="02">
                         <persName>Иван</persName>
                     </person>
                 </listPerson>
              </particDesc>
          </profileDesc>
    </teiHeader>
    <text>    #работа с самим текстом
        Текст текст текст <speech>-Какая-то прямая речь</speech> Текст текст текст <speech>-Какая-то прямая речь</speech>
    </text>
</TEI>

2. Выполните разметку фрагмента (назначенный вам текст и фрагмент по этой ссылке), выделив персоналии (c помощью <persName> для обозначения персоналии) и места (<placeName>). (5 баллов)

Текст текст текст <person xml:id="01"><persName>имя</persName></person> текст текст

Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (см. образец).

Подробнее о том, как оформляются персоналии и места, можно узнать тут: http://tei.it.ox.ac.uk/Talks/2015-03-lyon/talk-2-3-entities.xml

Бонусная часть:

+1 балл за разметку всех отрывков из первой части задания

💻 Домашнее задание 3

Дедлайн: Мягкий дедлайн - 3 апреля, жесткий дедлайн - 7 апреля 23.59.

Важно: После дедлайна работы не принимаются.

Задание состоит из трёх частей.

1. AntConc

1. Создайте txt с вашим текстом (полное произведение), лемматизируйте его с помощью Mystem (презентация 8). Формат текста - UTF-8, проверить можно в любом текстовом редакторе (Sublime Text, NotePad++) (1 балл)

2. Откройте его в AntConc, посмотрите самые частотные слова (Word List).

3. Добавьте список стоп-слов (см. презентацию).

4. Кликнув на 3 устаревших слова, посмотрите их конкордансы. (2 балл)

5. Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. (1 балл)

6. Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. (1 балл)

7. Приложите скриншоты выполнения заданий 4-6

2. Google Ngrams и НКРЯ

1. Изучите фрагмент вашего текста, выделите устаревшие слова.

2. Сравните их употребление с современными аналогами в Google Ngrams и НКРЯ. Сделайте выводы. (2 балла)

3. Посчитайте ipm для каждого слова по основному корпусу в НКРЯ. (1 балл)

3. Использование инструментов корпусного анализа в профессиональной деятельности.

1. Как исследование корпуса помогло вам в понимании текста, что нового вы узнали, оказались ли для вас полезными в решении конкретной задачи и не только изученные инструменты? (2 балла)

Цифровая Грамотность ДЗ Филологи — различия между версиями

Текущая версия на 18:38, 18 марта 2019

💻 Домашнее задание 1

💻 Домашнее задание 2

💻 Домашнее задание 3

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Действия

Поиск

Навигация

Инструменты

@@ Строка 39: / Строка 39: @@
 == 💻 Домашнее задание 2 ==
-'''Дедлайн:''' Мягкий дедлайн - 26 февраля, жесткий дедлайн - 28 февраля 23.59.
+'''Дедлайн:''' Мягкий дедлайн - 26 февраля, жесткий дедлайн - 3 марта 23.59.
 '''Важно:''' После дедлайна работы не принимаются.
@@ Строка 70: / Строка 70: @@
               </respStmt>
            </fileDesc>
+          <profileDesc>      # задаем список персонажей
+              <particDesc>
+                  <listPerson type="historical">   # тип персонажа исторический, художественнный...(класс можно придумать самостоятельно)
+                      <person xml:id="01">     # айди - буквы, цифры, названия - на ваш выбор
+                          <persName>Маша</persName> # выделяем персонажа
+                      </person>
+                      <person xml:id="02">
+                          <persName>Иван</persName>
+                      </person>
+                  </listPerson>
+               </particDesc>
+           </profileDesc>
       </teiHeader>
       <text>    #работа с самим текстом
@@ Строка 77: / Строка 89: @@
 . Выполните разметку фрагмента (назначенный вам текст и фрагмент [https://docs.google.com/spreadsheets/d/1khSFOs4wlN7hwafi0x9xbPurA6HhdR_klv4sZ2Y8bUQ/edit?usp=sharing по этой ссылке]), выделив персоналии (c помощью <persName> для обозначения персоналии) и места (<placeName>).  (5 баллов)
+Текст текст текст <person xml:id="01"><persName>имя</persName></person> текст текст
 Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (см. образец).
 Подробнее о том, как оформляются персоналии и места, можно узнать тут: http://tei.it.ox.ac.uk/Talks/2015-03-lyon/talk-2-3-entities.xml
+'''Бонусная часть:'''
++1 балл за разметку всех отрывков из первой части задания
+== 💻 Домашнее задание 3 ==
+'''Дедлайн:''' Мягкий дедлайн - 3 апреля, жесткий дедлайн - 7 апреля 23.59.
+'''Важно:''' После дедлайна работы не принимаются.
+Задание состоит из трёх частей.
+'''1. AntConc'''
+. Создайте txt с вашим текстом (полное произведение), лемматизируйте его с помощью Mystem (презентация 8). Формат текста - UTF-8, проверить можно в любом текстовом редакторе (Sublime Text, NotePad++) ''(1 балл)''
+. Откройте его в AntConc, посмотрите самые частотные слова (Word List).
+. Добавьте список стоп-слов (см. презентацию).
+. Кликнув на 3 устаревших слова, посмотрите их конкордансы. ''(2 балл)''
+. Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. ''(1 балл)''
+. Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. ''(1 балл)''
+. Приложите скриншоты выполнения заданий 4-6
+'''2. Google Ngrams и НКРЯ'''
+. Изучите фрагмент вашего текста, выделите устаревшие слова.
+. Сравните их употребление с современными аналогами в Google Ngrams и НКРЯ. Сделайте выводы. ''(2 балла)''
+. Посчитайте ipm для каждого слова по основному корпусу в НКРЯ. ''(1 балл)''
+'''3. Использование инструментов корпусного анализа в профессиональной деятельности.'''
+. Как исследование корпуса помогло вам в понимании текста, что нового вы узнали, оказались ли для вас полезными в решении конкретной задачи и не только изученные инструменты? ''(2 балла)''