Цифровая грамотность домашки — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(добавлено второе дз)
Строка 9: Строка 9:
 
'''Бонусные баллы'''<br />
 
'''Бонусные баллы'''<br />
 
За дополнительное оформление персональной странички.
 
За дополнительное оформление персональной странички.
 +
 +
 +
== Задание 2 ==
 +
'''Дедлайн 20.09.2017 23:59.'''<br />
 +
0. '''Установить''' [https://notepad-plus-plus.org/ notepad++] или [https://www.geany.org/ Geany] (или любой другой редактор, способный работать с регулярными выражениями).<br />
 +
1. Дан файл [https://drive.google.com/open?id=0ByLHeRX-gMWMSk1IblczSV83azA опрос.txt]. Это часть ответов на [https://docs.google.com/forms/d/e/1FAIpQLSfpxfbIcvC3vLfVvRlmfoysZmR-COSlbGulmzrAFVz3EmoO0g/viewform опрос] с [http://wiki.cs.hse.ru/Цифровая_грамотность Wiki]-страницы. Файл отличается от задания с семинара! '''Задание''': выписать регулярное выражение, которое найдет все записи, относящиеся к Вашей группе. <br />
 +
2. Дан файл [https://drive.google.com/open?id=0ByLHeRX-gMWMbjNISEF4elJHYzA emails.txt]. Это коллекция email-писем корпорации [https://ru.wikipedia.org/wiki/Enron Enron] ([https://www.kaggle.com/wcukierski/enron-email-dataset#_=_ оригинал]). '''Задание''': выписать регулярное выражение, которое найдет все e-mail адреса в файле, начинающиеся с латинской буквы '''O''' без учета регистра (то есть и с заглавной O, и с прописной o).<br />
 +
3. '''Бонусное задание''': для файла [https://drive.google.com/open?id=0ByLHeRX-gMWMbjNISEF4elJHYzA emails.txt] выписать регулярное выражение, которое найдет все письма, отправленные в период времени 00:00-03:00. Регулярное выражение должно выдавать именно строки с message-ID.<br />
 +
 +
''' Важно! Правила сдачи: '''<br />
 +
Создаем отдельный репозиторий на [https://github.com/ GitHub] (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем '''DL_homework_2'''. Под каждое задание нужен отдельный файл в репозитории с именами '''task_1.txt''', '''task_2.txt''', '''task_3.txt'''
 +
==== Формат файла task_X.txt: ====
 +
1. На первой строке файла: регулярное выражение.<br />
 +
2. На второй строке файла: сколько было найдено совпадений по этому регулярному выражению. Число!<br />
 +
3. Далее: Строки, найденные этим регулярным выражением.<br />
 +
 +
'''Внимание: При нарушении правил сдачи задание может быть оценено в 0 баллов!'''<br />
 +
 +
P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на [http://wiki.cs.hse.ru/Цифровая_грамотность Wiki].

Версия 15:35, 13 сентября 2017

Задание 1.

Дедлайн 11.09.2017 23:59.
Важно: После дедлайна работы не принимаются.

  1. Установить SourceTree или оригинальный Git-клиент, кому не удалось это сделать на семинаре.
  2. Сделать свой сайт (персональную страничку) на Github-Pages, описанный в конце семинарского конспекта.
    Требования к страничке: заголовок, фото или картинка, коротко о себе, одна-две ссылки на vk или github-профиль.
  3. Пройти опрос с wiki-страницы, чтобы мы могли проверить пункт 2.

Бонусные баллы
За дополнительное оформление персональной странички.


Задание 2

Дедлайн 20.09.2017 23:59.
0. Установить notepad++ или Geany (или любой другой редактор, способный работать с регулярными выражениями).
1. Дан файл опрос.txt. Это часть ответов на опрос с Wiki-страницы. Файл отличается от задания с семинара! Задание: выписать регулярное выражение, которое найдет все записи, относящиеся к Вашей группе.
2. Дан файл emails.txt. Это коллекция email-писем корпорации Enron (оригинал). Задание: выписать регулярное выражение, которое найдет все e-mail адреса в файле, начинающиеся с латинской буквы O без учета регистра (то есть и с заглавной O, и с прописной o).
3. Бонусное задание: для файла emails.txt выписать регулярное выражение, которое найдет все письма, отправленные в период времени 00:00-03:00. Регулярное выражение должно выдавать именно строки с message-ID.

Важно! Правила сдачи:
Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем DL_homework_2. Под каждое задание нужен отдельный файл в репозитории с именами task_1.txt, task_2.txt, task_3.txt

Формат файла task_X.txt:

1. На первой строке файла: регулярное выражение.
2. На второй строке файла: сколько было найдено совпадений по этому регулярному выражению. Число!
3. Далее: Строки, найденные этим регулярным выражением.

Внимание: При нарушении правил сдачи задание может быть оценено в 0 баллов!

P.S. По вопросам, связанным с дз, обращайтесь, пожалуйста, в Telegram-группы нашего курса. Ссылки есть на Wiki.