Цифровая грамотность суперсекретно — различия между версиями
| Строка 29: | Строка 29: | ||
''Путилов Спиридон - подьячий Потешного двора, 15 июля 1670 г. по 1671 г.;''<br /> | ''Путилов Спиридон - подьячий Потешного двора, 15 июля 1670 г. по 1671 г.;''<br /> | ||
''Путилов Спиридон - 8 июля 1671 г. подьячий.''<br /> | ''Путилов Спиридон - 8 июля 1671 г. подьячий.''<br /> | ||
| − | (Совет: используйте обратные ссылки \ | + | (Совет: используйте обратные ссылки \1 \2 и.т.д.)<br /> |
'''2.''' С помощью регулярных выражений из исходного текста получите столбец с '''именами и фамилиями'''.<br /> | '''2.''' С помощью регулярных выражений из исходного текста получите столбец с '''именами и фамилиями'''.<br /> | ||
| − | '''3.''' С помощью регулярных выражений из исходного текста получите столбец с '''датами начала службы'''.<br /> | + | '''3.''' С помощью регулярных выражений из исходного текста получите столбец с '''должностями''' - дьяк или подьячий<br /> |
| − | ''' | + | Давайте заметим, что теперь в каждой записи ровно по два четырехзнычных числа - дата начала и окончания службы.<br /> |
| − | ''' | + | '''4.''' С помощью регулярных выражений из исходного текста получите столбец с '''датами начала службы'''.<br /> |
| + | '''5.''' С помощью регулярных выражений из исходного текста получите столбец с '''датами окончания службы'''. Обратите внимание, что таких может и не быть в записи. В этом случае, ячейка должна пустовать.<br /> | ||
| + | '''6.''' Перенесите столбцы в Excel/Google Sheets. <br /> | ||
''' Важно! Правила сдачи: '''<br /> | ''' Важно! Правила сдачи: '''<br /> | ||
| Строка 42: | Строка 44: | ||
...<br /> | ...<br /> | ||
''4 строка: Использовал регулярное выражение: ... заменил все вхождения на ...<br />'' | ''4 строка: Использовал регулярное выражение: ... заменил все вхождения на ...<br />'' | ||
| + | ''5 строка: Использовал регулярное выражение: ... заменил все вхождения на ...<br />'' | ||
P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на [http://wiki.cs.hse.ru/Цифровая_грамотность Wiki]. | P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на [http://wiki.cs.hse.ru/Цифровая_грамотность Wiki]. | ||
Версия 00:21, 2 октября 2017
Задание 4
Дедлайн 09.10.2017 23:59.
0. Выполните бонусную часть или скачайте готовую таблицу.
1. Постройте столбец "Предполагаемое окончание службы" по правилу: Если в тексте не найдено окончание службы, то оно равно началу службы + 1 год.
2. Подсчитайте длительность службы для каждого дьяка/подьячего. Подсчитайте, сколько в среднем служили дьяки и подьячие и запишите в конце столбца "Длительность" .
3. Отсортируйте дьяков и подьячих по длительностям службы по убыванию.
4. Постройте столбчатую диаграмму по срокам службы.
5. Бонусное задание: С помощью Условного форматирования покрасьте одним цветом дьяков, другим - подьячих.
6. Сохраните полученную таблицу в PDF-формате.
Бонусная часть - извлечение данных из исходника с помощью регулярных выражений
Скачайте файл с отрывком из работы С. Б. Веселовского ДЬЯКИ И ПОДЬЯЧИЕ XV -XVII ВВ.
Вам необходимо получить таблицу в Excel/Google Sheets с должностями и сроками службы вида:
| Имя, Фамилия | Должность | Начало службы | Окончание службы, найденное в тексте | Предполагаемое окончание службы | Длительность |
|---|---|---|---|---|---|
| Амирев Артемий | подьячий | 1646 | 1648 | 1648 | 2 |
| Амирев Василий | дьяк | 1529 | 1530 | 1 |
Чтобы ее построить, решите вспомогательные задания:
1. Обратите внимание на записи, где для одного человека указаны несколько должностей, например
Путилов Спиридон - подьячий Потешного двора, 15 июля 1670 г. по 1671 г.; 8 июля 1671 г. подьячий.
С помощью регулярных выражений замените каждую такую запись на две отдельные записи:
Путилов Спиридон - подьячий Потешного двора, 15 июля 1670 г. по 1671 г.;
Путилов Спиридон - 8 июля 1671 г. подьячий.
(Совет: используйте обратные ссылки \1 \2 и.т.д.)
2. С помощью регулярных выражений из исходного текста получите столбец с именами и фамилиями.
3. С помощью регулярных выражений из исходного текста получите столбец с должностями - дьяк или подьячий
Давайте заметим, что теперь в каждой записи ровно по два четырехзнычных числа - дата начала и окончания службы.
4. С помощью регулярных выражений из исходного текста получите столбец с датами начала службы.
5. С помощью регулярных выражений из исходного текста получите столбец с датами окончания службы. Обратите внимание, что таких может и не быть в записи. В этом случае, ячейка должна пустовать.
6. Перенесите столбцы в Excel/Google Sheets.
Важно! Правила сдачи:
Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем DL_homework_4. Под задание нужен отдельный файл в репозитории с именем table.pdf с построенной таблицей и файл bonus.txt.
Формат файла bonus.txt:
Первые четыре строки должны содержать описание того, что Вы делали, чтобы решить каждое задание из бонусной части. Например:
1 строка: Использовал регулярное выражение: ... заменил все вхождения на ...
...
4 строка: Использовал регулярное выражение: ... заменил все вхождения на ...
5 строка: Использовал регулярное выражение: ... заменил все вхождения на ...
P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на Wiki.