Домашние задания по ЦГ история 2018 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м
(добавлено дз 3)
Строка 1: Строка 1:
 +
== Задание 3 ==
 +
'''Дедлайн 14.11.2018 23:59'''. <br />
  
 +
Скачайте [https://drive.google.com/file/d/0ByLHeRX-gMWMUFFsbG9VWUpMLUk/view?usp=sharing '''файл'''] с [https://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%B2%D0%B5%D1%81%D1%82%D1%8C_%D0%B2%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D1%8B%D1%85_%D0%BB%D0%B5%D1%82 Повестью Временных Лет].<br />
 +
Летопись необходимо отредактировать следующим образом:<br />
 +
'''1.''' Удалить все пустые строки.<br />
 +
'''2.''' После каждого знака препинания поставить пробел (но выставлять их стоит только если того требуют правила русского языка).<br />
 +
'''3.''' Найти всех князей и города, имя и название которых оканчивается на "слав".<br />
 +
'''4.''' Найти все упоминания Новгорода. Учтите, что написание может быть разным.<br />
 +
 +
''' Важно! Правила сдачи: '''<br />
 +
Задание выполняется в гугл-доке. Гугл-док необходимо поместить в папку, в которой находятся ваши размеченные тексты.
 +
 +
Название у файла должно быть следующим:
 +
'''%Surname%_regex'''
 +
==== Формат файла task_1.txt: ====
 +
Первые четыре строки должны содержать описание того, что Вы делали, чтобы решить каждое задание. Например:<br />
 +
''1 строка: Использовал регулярное выражение: ... заменил все вхождения на ...''<br />
 +
''2 строка: Использовал регулярное выражение: ... заменил все вхождения на ...''<br />
 +
''3 строка: Использовал регулярное выражение: ... Всего упоминаний о князьях нашел: (число)<br />''
 +
''4 строка: Использовал регулярное выражение: ... Всего упоминаний Новгорода нашел: (число)<br />''
 +
 +
На следующих строках должна быть летопись после обработки.<br />
 +
<b>Каждый шаг сопровождаете скриншотами!</b> Чтобы было видно, что искали, на что заменяли.
 +
 +
'''Внимание: При нарушении правил сдачи задание может быть оценено в 0 баллов!'''<br />
  
 
== Задание 2 ==  
 
== Задание 2 ==  

Версия 00:27, 4 ноября 2018

Задание 3

Дедлайн 14.11.2018 23:59.

Скачайте файл с Повестью Временных Лет.
Летопись необходимо отредактировать следующим образом:
1. Удалить все пустые строки.
2. После каждого знака препинания поставить пробел (но выставлять их стоит только если того требуют правила русского языка).
3. Найти всех князей и города, имя и название которых оканчивается на "слав".
4. Найти все упоминания Новгорода. Учтите, что написание может быть разным.

Важно! Правила сдачи:
Задание выполняется в гугл-доке. Гугл-док необходимо поместить в папку, в которой находятся ваши размеченные тексты.

Название у файла должно быть следующим: %Surname%_regex

Формат файла task_1.txt:

Первые четыре строки должны содержать описание того, что Вы делали, чтобы решить каждое задание. Например:
1 строка: Использовал регулярное выражение: ... заменил все вхождения на ...
2 строка: Использовал регулярное выражение: ... заменил все вхождения на ...
3 строка: Использовал регулярное выражение: ... Всего упоминаний о князьях нашел: (число)
4 строка: Использовал регулярное выражение: ... Всего упоминаний Новгорода нашел: (число)

На следующих строках должна быть летопись после обработки.
Каждый шаг сопровождаете скриншотами! Чтобы было видно, что искали, на что заменяли.

Внимание: При нарушении правил сдачи задание может быть оценено в 0 баллов!

Задание 2

Дедлайн 19.10.2018 23:59.
Важно: После дедлайна работы принимаются со штрафом. Если работа вообще не сдана - это 0.

Проведите формулярный анализ актов, над которыми вы работали в ДЗ 1.

Инструкция по формулярному анализу и разметке.

Шпаргалка по формулярному анализу с примерами.

Конспект семинара 4 по формулярному анализу.

Примеры разметки.

Размеченный текст нужно поместить в файл с TEI header-ом, над которым вы работали в ДЗ 1. Полученный файл сохраните в формате .xml. Название у файла должно быть следующим:

ASEI_%vol%_%idno%_%Surname%_%markup%.xml

Здесь вместо %vol% нужно вписать номер тома (1), вместо %idno% - номер акта (с ведущими нулями, если номер не трехзначный, например, 001, 010), вместо %Surname% - вашу фамилию, как она указана в названии папке из пункта 1.

Пример: ASEI_1_001_Sarkisyan_markup.xml

Пример итогового файла (хедер + разметка).

Важно! Не заменяйте этим файлом файл с ДЗ 1 в своей папке, добавьте этот файл к существующим.

Задание 1

Дедлайн 05.10.2018 23:59.
Важно: После дедлайна работы принимаются со штрафом. Если работа вообще не сдана - это 0.

1. Создайте папку под своей фамилией в папке своей группы в папке курса

2. Настройте в папке права доступа: доступ должен быть только у лекторов, семинаристов и ассистента вашей группы (контакты есть на Вики в разделе "Преподаватели").

3. Сделайте вычитку своих актов: для этого найдите номера своих текстов в табличке. Скопируйте тексты из оригинала в pdf в Sublime Text. Некоторые символы скопируются с ошибками: ваша задача устранить все расхождения между оригиналом и получившимся текстом (исправить буквы, удалить лишние пробелы и переносы строк). Конспект, в котором описаны все дополнительные кириллические буквы.

4. Сделайте разметку вычитанных актов: в данном дз проводить формулярный анализ не требуется, достаточно только оформить хедер TEI. Важно: каждый акт нужно сохранять в отдельном файле.

Шпаргалка по составлению хедера.

Примеры хедера для текстов из второго тома АСЭИ один, два, три.

5. Сохраните полученные файлы с разметкой в формате xml. Название файла должно быть следующим:

ASEI_%vol%_%idno%_%Surname%.xml

Здесь вместо %vol% нужно вписать номер тома (1), вместо %idno% - номер акта (с ведущими нулями, если номер не трехзначный, например, 001, 010), вместо %Surname% - вашу фамилию, как она указана в названии папке из пункта 1.

Пример: ASEI_1_001_Sarkisyan.xml

6. Загрузите полученные файлы в вашу папку из пункта 1.