Цифровая грамотность суперсекретно — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Задание 3)
Строка 18: Строка 18:
  
 
На следующих строках должна быть летопись после обработки.<br /><br />
 
На следующих строках должна быть летопись после обработки.<br /><br />
 +
 +
P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на [http://wiki.cs.hse.ru/Цифровая_грамотность Wiki].
 +
 +
== Задание 4 ==
 +
'''Дедлайн 09.10.2017 23:59'''. <br />
 +
 +
Скачайте [https://drive.google.com/file/d/0ByLHeRX-gMWMT2dxTTA0TWZXc1E/view?usp=sharing '''файл'''] с отрывком из работы С. Б. Веселовского [https://elibrary.ru/item.asp?id=22024689 ДЬЯКИ И ПОДЬЯЧИЕ XV -XVII ВВ].<br />
 +
Вам необходимо получить таблицу в Excel/Google Sheets с должностями и сроками службы вида:<br />
 +
 +
{| class="wikitable"
 +
|-
 +
! Имя, Фамилия !! Должность  !! Начало службы !! Окончание службы, найденное в тексте !! Предполагаемое окончание службы !! Длительность
 +
|-
 +
| Амирев Артемий || подьячий || 1646 || 1648 || 1648 || 2
 +
|-
 +
| Амирев Василий || дьяк || 1529 ||  || 1530 || 1
 +
|}
 +
 +
Чтобы ее построить, решите вспомогательные задания:<br />
 +
'''1.''' Обратите внимание на записи, где для одного человека указаны несколько должностей, например <br />
 +
''Путилов Спиридон - подьячий Потешного двора, 15 июля 1670 г. по 1671 г.; 8 июля 1671 г. подьячий.''<br />
 +
'''Замените с помощью регулярных выражений такую запись на две отдельные записи''':<br />
 +
''Путилов Спиридон - подьячий Потешного двора, 15 июля 1670 г. по 1671 г.;''<br />
 +
''Путилов Спиридон - 8 июля 1671 г. подьячий.''<br />
 +
Совет: используйте обратные ссылки \1 \2 \3.<br />
 +
'''2.''' С помощью регулярных выражений из исходного текста получите '''столбец с именами и фамилиями'''.<br />
 +
'''3.''' С помощью регулярных выражений из исходного текста получите '''столбец с датами начала службы'''.<br />
 +
'''4.''' С помощью регулярных выражений из исходного текста получите '''столбец с датами окончания службы'''. Обратите внимание, что таких может и не быть в записи. В этом случае, ячейка должна пустовать.<br />
 +
'''5.''' Перенесите столбцы в Excel/Google Sheets. <br />
 +
'''6.''' Постройте столбец "Предполагаемое окончание службы" по правилу: Если в тексте не найдено окончание службы, то оно равно началу + 1 год.<br />
 +
'''7.''' Посчитайте длительность службы. Подсчитайте, сколько в среднем служили дьяки и подьячие. <br />
 +
'''8.''' Сохраните таблицу в PDF-формате.<br />
 +
 +
''' Важно! Правила сдачи: '''<br />
 +
Создаем отдельный репозиторий на [https://github.com/ GitHub] (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем '''DL_homework_4'''. Под задание нужен отдельный файл в репозитории с именем '''table.pdf''' с построенной таблицей и файл '''task_1.txt'''.
 +
==== Формат файла task_1.txt: ====
 +
Первые четыре строки должны содержать описание того, что Вы делали, чтобы решить каждое задание. Например:<br />
 +
''1 строка: Использовал регулярное выражение: ... заменил все вхождения на ...''<br />
 +
...<br />
 +
''4 строка: Использовал регулярное выражение: ... заменил все вхождения на ...<br />''
 +
  
 
P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на [http://wiki.cs.hse.ru/Цифровая_грамотность Wiki].
 
P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на [http://wiki.cs.hse.ru/Цифровая_грамотность Wiki].

Версия 18:15, 1 октября 2017

Задание 3

Дедлайн 29.09.2017 23:59.

Скачайте файл с Повестью Временных Лет.
Летопись необходимо отредактировать следующим образом:
1. Удалить все пустые строки.
2. После каждого знака препинания поставить пробел.
3. Найти всех князей, имя которых оканчивается на "слав".
4. Найти все упоминания Новгорода. Учтите, что написание может быть разным.

Важно! Правила сдачи:
Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем DL_homework_3. Под задание нужен отдельный файл в репозитории с именем task_1.txt.

Формат файла task_1.txt:

Первые четыре строки должны содержать описание того, что Вы делали, чтобы решить каждое задание. Например:
1 строка: Использовал регулярное выражение: ... заменил все вхождения на ...
...
4 строка: Использовал регулярное выражение: ...

На следующих строках должна быть летопись после обработки.

P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на Wiki.

Задание 4

Дедлайн 09.10.2017 23:59.

Скачайте файл с отрывком из работы С. Б. Веселовского ДЬЯКИ И ПОДЬЯЧИЕ XV -XVII ВВ.
Вам необходимо получить таблицу в Excel/Google Sheets с должностями и сроками службы вида:

Имя, Фамилия Должность Начало службы Окончание службы, найденное в тексте Предполагаемое окончание службы Длительность
Амирев Артемий подьячий 1646 1648 1648 2
Амирев Василий дьяк 1529 1530 1

Чтобы ее построить, решите вспомогательные задания:
1. Обратите внимание на записи, где для одного человека указаны несколько должностей, например
Путилов Спиридон - подьячий Потешного двора, 15 июля 1670 г. по 1671 г.; 8 июля 1671 г. подьячий.
Замените с помощью регулярных выражений такую запись на две отдельные записи:
Путилов Спиридон - подьячий Потешного двора, 15 июля 1670 г. по 1671 г.;
Путилов Спиридон - 8 июля 1671 г. подьячий.
Совет: используйте обратные ссылки \1 \2 \3.
2. С помощью регулярных выражений из исходного текста получите столбец с именами и фамилиями.
3. С помощью регулярных выражений из исходного текста получите столбец с датами начала службы.
4. С помощью регулярных выражений из исходного текста получите столбец с датами окончания службы. Обратите внимание, что таких может и не быть в записи. В этом случае, ячейка должна пустовать.
5. Перенесите столбцы в Excel/Google Sheets.
6. Постройте столбец "Предполагаемое окончание службы" по правилу: Если в тексте не найдено окончание службы, то оно равно началу + 1 год.
7. Посчитайте длительность службы. Подсчитайте, сколько в среднем служили дьяки и подьячие.
8. Сохраните таблицу в PDF-формате.

Важно! Правила сдачи:
Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем DL_homework_4. Под задание нужен отдельный файл в репозитории с именем table.pdf с построенной таблицей и файл task_1.txt.

Формат файла task_1.txt:

Первые четыре строки должны содержать описание того, что Вы делали, чтобы решить каждое задание. Например:
1 строка: Использовал регулярное выражение: ... заменил все вхождения на ...
...
4 строка: Использовал регулярное выражение: ... заменил все вхождения на ...


P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на Wiki.