Цифровая Грамотность ДЗ Филологи

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

💻 Домашнее задание 1

Дедлайн: Мягкий дедлайн - 5 февраля, жесткий дедлайн - 7 февраля 23.59.

Важно: После дедлайна работы не принимаются.


Для выполнения задания воспользуйтесь:

1) Текстовым редактором Sublime Text или NotePad++

2) Выберите один из вариантов выполнения:

а) конструктором сайтов (WIX или Tilda, ссылку на свой сайт после публикации необходимо разместить в README.md, где мы работали с Markdown)

б) CSS фреймворком Bootstrap (инструкция по подключению к GitHub Pages находится в презентации в комментариях докладчика).

в) самостоятельно с использованием html + css


Суть задания: Необходимо создать сайт, на котором будет помещена следующая информация:

1. Заголовок (1 балл)

2. Данные об исследователе: ваши фио, место учебы, научные интересы, немного о себе. (2 балл)

3. Прикрепить фото к биографии и картинку к тексту. (2 балла)

4. Текстовый раздел с коротким текстом (3-5 предложений) на тему "Как современные технологии могут помочь филологу" (2 балла)

5. Текстовый раздел с коротким анализом достоинств и недостатков сайтов из списка (презентация семинара 3, слайд 15), либо любого специализированного сайта на ваш выбор + скриншот и ссылка на ресурс. (3 балла)

Бонусная часть:

+2 балла за вариант выполнения задания "самостоятельно с использованием html + css"


💻 Домашнее задание 2

Дедлайн: Мягкий дедлайн - 26 февраля, жесткий дедлайн - 3 марта 23.59.

Важно: После дедлайна работы не принимаются.


0. Для выполнения задания воспользуйтесь текстовым редактором NotePad++ или Sublime Text (можно любой другой на ваш выбор для Mac OS).

Файлы с отрывками сохраняйте в формате .txt .

Размеченные отрывки выкладываем на Github в репозиторий HW2.


1. Выполните разметку прямой речи любого отрывка из этого списка. (5 баллов)

О тегах можно прочитать тут: https://github.com/DanilSko/speech/wiki

Образец: https://docs.google.com/presentation/d/1qKQOF2ZvSW-iSQN7z0xFh4D_NTTVLpAyUzFYSQKRzpM/edit#slide=id.g4e2f895de0_0_11 (слайд 12)

Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (слайд 6 и образец):

<TEI> #объявляем tei
    <teiHeader>  #информация об источнике
        <fileDesc>
            <titleStmt>
               <title>Название книги</title>
            </titleStmt>
            <respStmt>
                <persName>Иван Петров</persName>
                <resp>Что делал с документов (создание TEI документа, выделение в тексте прямой речи/ персоналий/мест)</resp>
            </respStmt>
         </fileDesc>
         <profileDesc>      # задаем список персонажей
             <particDesc>
                 <listPerson type="historical">   # тип персонажа исторический, художественнный...(класс можно придумать самостоятельно)
                     <person xml:id="01">     # айди - буквы, цифры, названия - на ваш выбор
                         <persName>Маша</persName> # выделяем персонажа
                     </person>
                     <person xml:id="02">
                         <persName>Иван</persName>
                     </person>
                 </listPerson>
              </particDesc>
          </profileDesc>
    </teiHeader>
    <text>    #работа с самим текстом
        Текст текст текст <speech>-Какая-то прямая речь</speech> Текст текст текст <speech>-Какая-то прямая речь</speech>
    </text>
</TEI>

2. Выполните разметку фрагмента (назначенный вам текст и фрагмент по этой ссылке), выделив персоналии (c помощью <persName> для обозначения персоналии) и места (<placeName>). (5 баллов)

Текст текст текст <person xml:id="01"><persName>имя</persName></person> текст текст

Уточнение: оформите отрывок в соответствии со стандартом оформления документов в tei (см. образец).

Подробнее о том, как оформляются персоналии и места, можно узнать тут: http://tei.it.ox.ac.uk/Talks/2015-03-lyon/talk-2-3-entities.xml

Бонусная часть:

+1 балл за разметку всех отрывков из первой части задания

💻 Домашнее задание 3

Дедлайн: Мягкий дедлайн - 3 апреля, жесткий дедлайн - 7 апреля 23.59.

Важно: После дедлайна работы не принимаются.

Задание состоит из трёх частей.

1. AntConc

1. Создайте txt с вашим текстом (полное произведение), лемматизируйте его с помощью Mystem (презентация 8). Формат текста - UTF-8, проверить можно в любом текстовом редакторе (Sublime Text, NotePad++) (1 балл)

2. Откройте его в AntConc, посмотрите самые частотные слова (Word List).

3. Добавьте список стоп-слов (см. презентацию).

4. Кликнув на 3 устаревших слова, посмотрите их конкордансы. (2 балл)

5. Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. (1 балл)

6. Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. (1 балл)

7. Приложите скриншоты выполнения заданий 4-6

2. Google Ngrams и НКРЯ

1. Изучите фрагмент вашего текста, выделите устаревшие слова.

2. Сравните их употребление с современными аналогами в Google Ngrams и НКРЯ. Сделайте выводы. (2 балла)

3. Посчитайте ipm для каждого слова по основному корпусу в НКРЯ. (1 балл)

3. Использование инструментов корпусного анализа в профессиональной деятельности.

1. Как исследование корпуса помогло вам в понимании текста, что нового вы узнали, оказались ли для вас полезными в решении конкретной задачи и не только изученные инструменты? (2 балла)