Домашние задания по Цифровой грамотности 2018 (2 семестр) — различия между версиями
Liza (обсуждение | вклад) |
Anyaat (обсуждение | вклад) м (добавлено дз 8 филологи) |
||
(не показано 15 промежуточных версии 3 участников) | |||
Строка 69: | Строка 69: | ||
== Домашнее задание 6 (NGrams&AntConc) == | == Домашнее задание 6 (NGrams&AntConc) == | ||
− | '''Дедлайн | + | '''Дедлайн 9 апреля 2018 23:59'''. <br /> |
'''Важно''': После дедлайна работы не принимаются. <br /> | '''Важно''': После дедлайна работы не принимаются. <br /> | ||
'''Правила сдачи''': Создаем отдельный репозиторий на [https://github.com/ GitHub] (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw6. Ответы на задания помещайте в readme. | '''Правила сдачи''': Создаем отдельный репозиторий на [https://github.com/ GitHub] (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw6. Ответы на задания помещайте в readme. | ||
Строка 89: | Строка 89: | ||
1. Найдите 10 самых частотных продолжений фразы "due to the". | 1. Найдите 10 самых частотных продолжений фразы "due to the". | ||
− | Сделайте скриншот графика и Вашего запроса. Скриншот поместите в | + | Сделайте скриншот графика и Вашего запроса. Скриншот поместите в ридми. |
В инструкции по Advanced Usage данный тип поиска называется Wildcard search. | В инструкции по Advanced Usage данный тип поиска называется Wildcard search. | ||
− | 2. Выберите слово, которое может одновременно относиться к 2 или более различным частям речи. Это может быть слово любого языка, представленного в Google Ngrams. Постройте график. На графике должны быть две кривые (или более). Для каждого слова должен был указан частеречный тэг. Сделайте скриншот графика и Вашего запроса. Скриншот поместите в | + | 2. Выберите слово, которое может одновременно относиться к 2 или более различным частям речи. Это может быть слово любого языка, представленного в Google Ngrams. Постройте график. На графике должны быть две кривые (или более). Для каждого слова должен был указан частеречный тэг. Сделайте скриншот графика и Вашего запроса. Скриншот поместите в ридми. |
См. в инструкции часть Part-of-speech Tags. | См. в инструкции часть Part-of-speech Tags. | ||
− | 3. Выберите два синонима: один характерный для британского английского, другой – для американского. Посмотрите в Google Ngrams, действительно ли это так (т.е. действительно ли слова характерны для разных вариантов английского). На графике должно быть четыре кривые: две отражают частотность первого слова в корпусе британского и американского английского, две – частотность второго слова. Сделайте скриншот графика и Вашего запроса. Скриншот поместите в | + | 3. Выберите два синонима: один характерный для британского английского, другой – для американского. Посмотрите в Google Ngrams, действительно ли это так (т.е. действительно ли слова характерны для разных вариантов английского). На графике должно быть четыре кривые: две отражают частотность первого слова в корпусе британского и американского английского, две – частотность второго слова. Сделайте скриншот графика и Вашего запроса. Скриншот поместите в ридми. |
− | Какие выводы Вы можете сделать из полученных данных? Приведите Ваши размышления в | + | Какие выводы Вы можете сделать из полученных данных? Приведите Ваши размышления в ридми. |
См. в инструкции часть Corpora, а также объяснения для corpus selection operator. | См. в инструкции часть Corpora, а также объяснения для corpus selection operator. | ||
Строка 114: | Строка 114: | ||
е) сделайте вывод об индивидуальных особенностях авторских стилей. Все наблюдения и иллюстрации объедините в отчет в свободной форме.<br /> | е) сделайте вывод об индивидуальных особенностях авторских стилей. Все наблюдения и иллюстрации объедините в отчет в свободной форме.<br /> | ||
ж) '''бонусное задание''': воспользуйтесь любой опцией, не указанной выше, которая может сообщить какую-либо дополнительную информацию о тексте.<br /> | ж) '''бонусное задание''': воспользуйтесь любой опцией, не указанной выше, которая может сообщить какую-либо дополнительную информацию о тексте.<br /> | ||
+ | |||
+ | == Домашнее задание 8 (ДИЯ) == | ||
+ | '''Дедлайн 29 апреля 2018 23:59'''. <br /> | ||
+ | '''Важно''': После дедлайна работы не принимаются. <br /> | ||
+ | '''Правила сдачи''': Создаем отдельный репозиторий на [https://github.com/ GitHub] (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw8. | ||
+ | |||
+ | [[Файл:Layout.jpg|мини|Укладка]] | ||
+ | <div class="tright" style="clear:none">[[Файл:Modularity.jpg|мини|Раскраска по классам модулярности]]</div> | ||
+ | <div class="tright" style="clear:none">[[Файл:Statistics.png|мини|Расчет модулярности]]</div> | ||
+ | [[Файл:DLiteracy HW6 rep.PNG|мини|Содержимое репозитория ("После этого" равно "после экспорта"), скриншот из конспекта семинара]] | ||
+ | '''1.''' Постройте ориентированный граф своих друзей, используя [https://vk.com/app3861133 приложение]. <br /> | ||
+ | '''2.''' Откройте полученный .gexf файл с помощью [https://gephi.org/ gephi]<br /> | ||
+ | Если не удаётся установить gephi или приложение выдаёт ошибку, ознакомьтесь с [https://www.dropbox.com/s/qi50cx2ly7zf7na/Gephi.pdf?dl=0 этой инструкцией]. <br /> | ||
+ | '''3.''' Измените внешний вид графа: запустите алгоритм укладки (раздел "Window"->"Layout"), подберите оптимальные значения параметров, отредактируйте ширину и цвет ребер графа, цвет и размер узлов. <br /> | ||
+ | '''4.''' Рассчитайте модулярность графа (раздел "Window"->"Statistics"->"Modularity") и раскрасьте граф по классам модулярности (раздел "Window"->"Appearance"->"Nodes"->"Partition"). Проанализируйте полученный результат: насколько корректные получились сообщества? Соответствуют ли они действительности? <br /> | ||
+ | '''5.''' Во вкладке "Preview" выберите фон, цвета подписей, размер узлов и.т.д.<br /> | ||
+ | '''6.''' Выгрузите граф в формате pdf. Файл загрузите в репозиторий.<br /> | ||
+ | '''бонусная часть:'''<br /> | ||
+ | '''7.''' Установите "Sigma.js export plugin" ("Tools"->"Plugins"->"Available Plugins").<br /> | ||
+ | '''8.''' Экспортируйте граф через Sigma.js plugin ("File"->"Export"->"Sigma.js template"). В первой строке необходимо указать директорию, куда граф будет экспортирован. Также укажите в соответствующих полях, что означают узлы, ребра и цвета, добавьте описание. Результатом экспорта является папка '''network''' в указанной директории.<br /> | ||
+ | '''9.''' Загрузите файлы из экспортированной папки '''network''' в репозиторий (Файл '''index.html''' и другие файлы рядом с ним (то есть все содержимое папки network) должны оказаться в корне репозитория, файл ".gitignore" необязателен!). В настройках репозитория "Settings"->"Github pages" выберите master-ветвь. После нажатия "Save" в этом разделе появится ссылка на github-страницу с графом. Укажите эту ссылку в файле '''README.md'''. | ||
+ | |||
+ | == Домашнее задание 7 == | ||
+ | '''Дедлайн 29 апреля 2018 23:59'''. <br /> | ||
+ | '''Важно''': После дедлайна работы не принимаются. <br /> | ||
+ | '''Правила сдачи''': Создаем отдельный репозиторий на [https://github.com/ GitHub] (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw7. | ||
+ | |||
+ | [[Файл:Layout.jpg|мини|Укладка]] | ||
+ | <div class="tright" style="clear:none">[[Файл:Modularity.jpg|мини|Раскраска по классам модулярности]]</div> | ||
+ | <div class="tright" style="clear:none">[[Файл:Statistics.png|мини|Расчет модулярности]]</div> | ||
+ | [[Файл:DLiteracy HW6 rep.PNG|мини|Содержимое репозитория ("После этого" равно "после экспорта"), скриншот из конспекта семинара]] | ||
+ | '''1.''' Постройте ориентированный граф своих друзей, используя [https://vk.com/app3861133 приложение]. <br /> | ||
+ | '''2.''' Откройте полученный .gexf файл с помощью [https://gephi.org/ gephi]<br /> | ||
+ | Если не удаётся установить gephi или приложение выдаёт ошибку, ознакомьтесь с [https://www.dropbox.com/s/qi50cx2ly7zf7na/Gephi.pdf?dl=0 этой инструкцией]. <br /> | ||
+ | '''3.''' Измените внешний вид графа: запустите алгоритм укладки (раздел "Window"->"Layout"), подберите оптимальные значения параметров, отредактируйте ширину и цвет ребер графа, цвет и размер узлов. <br /> | ||
+ | '''4.''' Рассчитайте модулярность графа (раздел "Window"->"Statistics"->"Modularity") и раскрасьте граф по классам модулярности (раздел "Window"->"Appearance"->"Nodes"->"Partition"). Проанализируйте полученный результат: насколько корректные получились сообщества? Соответствуют ли они действительности? <br /> | ||
+ | '''5.''' Во вкладке "Preview" выберите фон, цвета подписей, размер узлов и.т.д.<br /> | ||
+ | '''6.''' Выгрузите граф в формате pdf. Файл загрузите в репозиторий.<br /> | ||
+ | '''бонусная часть:'''<br /> | ||
+ | '''7.''' Установите "Sigma.js export plugin" ("Tools"->"Plugins"->"Available Plugins").<br /> | ||
+ | '''8.''' Экспортируйте граф через Sigma.js plugin ("File"->"Export"->"Sigma.js template"). В первой строке необходимо указать директорию, куда граф будет экспортирован. Также укажите в соответствующих полях, что означают узлы, ребра и цвета, добавьте описание. Результатом экспорта является папка '''network''' в указанной директории.<br /> | ||
+ | '''9.''' Загрузите файлы из экспортированной папки '''network''' в репозиторий (Файл '''index.html''' и другие файлы рядом с ним (то есть все содержимое папки network) должны оказаться в корне репозитория, файл ".gitignore" необязателен!). В настройках репозитория "Settings"->"Github pages" выберите master-ветвь. После нажатия "Save" в этом разделе появится ссылка на github-страницу с графом. Укажите эту ссылку в файле '''README.md'''. | ||
+ | |||
+ | |||
+ | == Домашнее задание 8 (Филология) == | ||
+ | '''Дедлайн 03.06.2018 23:59'''. <br /> | ||
+ | |||
+ | Скачайте [https://drive.google.com/file/d/0ByLHeRX-gMWMUFFsbG9VWUpMLUk/view?usp=sharing '''файл'''] с [https://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%B2%D0%B5%D1%81%D1%82%D1%8C_%D0%B2%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D1%8B%D1%85_%D0%BB%D0%B5%D1%82 Повестью Временных Лет].<br /> | ||
+ | Летопись необходимо отредактировать следующим образом:<br /> | ||
+ | '''1.''' Удалить все пустые строки.<br /> | ||
+ | '''2.''' Найти всех князей и города, имя и название которых оканчивается на "слав". В выдаче должны быть такие слова как "Ярославля, Ростиславъ, Ростиславу, Переяславлъ" и т.п. Но не должно быть "славу, выславше" и т.п. <br /> | ||
+ | '''3.''' Найти все упоминания Новгорода. Учтите, что написание может быть разным . В выдаче должны быть такие слова как "Новѣгородѣ, Новъгородъ, Новгородцю, Новагорода, Новугороду". <br /> | ||
+ | '''БОНУС:''' После каждого знака препинания поставить пробел (но выставлять их стоит только если того требуют правила русского языка). Например, надо добавить пробел после двоеточия, точки с запятой, запятой; перед квадратной скобкой должен быть пробел; после точки должен быть пробел, если до нее буква или кавычка, а после нее нет другой точки. | ||
+ | В идеале регулярное выражение должно быть в одну строку, но при необходимости можно использовать несколько. <br /> | ||
+ | |||
+ | |||
+ | ''' Важно! Правила сдачи: '''<br /> | ||
+ | Создаем отдельный репозиторий на [https://github.com/ GitHub]. | ||
+ | Под задание нужен отдельный файл в репозитории с именем '''result.txt''', в который вы скопируете летопись после обработки (то есть тот текст, который у вас получился после выполнения всех заданий) | ||
+ | В README.md вы описываете все, что делали: <br /> | ||
+ | ''Использовал регулярное выражение: ... заменил все вхождения на ...''<br /> | ||
+ | ''Использовал регулярное выражение: ... Всего упоминаний о князьях нашел: (число)<br />'' | ||
+ | ''Использовал регулярное выражение: ... Всего упоминаний Новгорода нашел: (число)<br />'' | ||
+ | |||
+ | '''Каждый шаг сопровождаете скриншотами!''' Чтобы было видно, что искали, на что заменяли. | ||
+ | |||
+ | |||
+ | |||
+ | == Домашнее задание 8 (ИИ и Культурологи) == | ||
+ | '''Дедлайн 19 мая 2018 23:59'''. <br /> | ||
+ | '''Важно''': После дедлайна работы не принимаются. <br /> | ||
+ | '''Правила сдачи''': Создаем отдельный репозиторий на [https://github.com/ GitHub] (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw8. <br /> | ||
+ | |||
+ | '''0.''' Ознакомьтесь с возможностями популярных конструкторов сайтов [https://ru.wix.com/ Wix], [https://tilda.cc/ru/ Tilda], [https://readymag.com ReadyMag]. <br /> | ||
+ | '''1.''' Выберите тему вашего будущего сайта. Это может быть ресурс о каком-либо мероприятии (выставка, концерт, лекция…), направлении в искусстве, интересной фигуре, либо сайт об одном из ваших учебных проектов. <br /> | ||
+ | '''2.''' Выделите на сайте область About (вкладка/текстовое поле/выпадающее меню), в которой будет рассказано о вашем ресурсе и его цели. <br /> | ||
+ | '''3.''' Кроме того, на сайте должны присутствовать следующие элементы: <br /> | ||
+ | а) Заголовок <br /> | ||
+ | б) Несколько страниц <br /> | ||
+ | в) Система навигации по разделам сайта <br /> | ||
+ | г) Контент: тексты (на каждой странице), картинки (не менее 3 на страницу), видео (опционально) <br /> | ||
+ | д) Форма регистрации на мероприятие (опционально) <br /> | ||
+ | е) Контакты <br /> | ||
+ | ж) Карта (опционально) <br /> | ||
+ | |||
+ | '''Бонус:''' <br /> | ||
+ | а. Используйте в качестве конструктора сайтов Tilda или ReadyMag <br /> | ||
+ | б. Адаптируйте дизайн ресурса под мобильные устройства. | ||
+ | |||
+ | == Домашнее задание 9 (ДИЯ) == | ||
+ | '''Дедлайн 01.06.2018 23:59'''. <br /> | ||
+ | |||
+ | Скачайте [https://drive.google.com/file/d/0ByLHeRX-gMWMUFFsbG9VWUpMLUk/view?usp=sharing '''файл'''] с [https://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%B2%D0%B5%D1%81%D1%82%D1%8C_%D0%B2%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D1%8B%D1%85_%D0%BB%D0%B5%D1%82 Повестью Временных Лет].<br /> | ||
+ | Летопись необходимо отредактировать следующим образом:<br /> | ||
+ | '''1.''' Удалить все пустые строки.<br /> | ||
+ | '''2.''' Найти всех князей и города, имя и название которых оканчивается на "слав". В выдаче должны быть такие слова как "Ярославля, Ростиславъ, Ростиславу, Переяславлъ" и т.п. Но не должно быть "славу, выславше" и т.п. <br /> | ||
+ | '''3.''' Найти все упоминания Новгорода. Учтите, что написание может быть разным . В выдаче должны быть такие слова как "Новѣгородѣ, Новъгородъ, Новгородцю, Новагорода, Новугороду". <br /> | ||
+ | '''БОНУС:''' После каждого знака препинания поставить пробел (но выставлять их стоит только если того требуют правила русского языка). Например, надо добавить пробел после двоеточия, точки с запятой, запятой; перед квадратной скобкой должен быть пробел; после точки должен быть пробел, если до нее буква или кавычка, а после нее нет другой точки. | ||
+ | В идеале регулярное выражение должно быть в одну строку, но при необходимости можно использовать несколько. <br /> | ||
+ | |||
+ | |||
+ | ''' Важно! Правила сдачи: '''<br /> | ||
+ | Создаем отдельный репозиторий на [https://github.com/ GitHub]. | ||
+ | Под задание нужен отдельный файл в репозитории с именем '''result.txt''', в который вы скопируете летопись после обработки (то есть тот текст, который у вас получился после выполнения всех заданий) | ||
+ | В README.md вы описываете все, что делали: <br /> | ||
+ | ''Использовал регулярное выражение: ... заменил все вхождения на ...''<br /> | ||
+ | ''Использовал регулярное выражение: ... Всего упоминаний о князьях нашел: (число)<br />'' | ||
+ | ''Использовал регулярное выражение: ... Всего упоминаний Новгорода нашел: (число)<br />'' | ||
+ | |||
+ | '''Каждый шаг сопровождаете скриншотами!''' Чтобы было видно, что искали, на что заменяли. |
Текущая версия на 10:56, 26 мая 2018
Содержание
Домашнее задание 1
Дедлайн 27 января 2018 23:59.
Важно: После дедлайна работы не принимаются.
Предварительная часть (для тех, кто этого еще не сделал):
- создать аккаунт на github
- зарегистрироваться в Telegram
- вступить в чат своей группы
- заполнить форму-анкету
Основная часть:
- Создать репозиторий с названием hw1
- Добавить в репозиторий README
- Заполнить README информацией о себе, уместно(!) используя как можно больше средств разметки markdown (заголовки, подзаголовки, выделения, списки, ссылки, картинки...).
Минимальный объём: 1000 знаков (с учетом элементов разметки).
Бонусная часть (за это начисляются дополнительные баллы):
- Добавить в README таблицу (например, это может быть ваше расписание)
Домашнее задание 2
Дедлайн 2 февраля 2018 23:59.
Важно: После дедлайна работы не принимаются.
Суть: Используя ворд (или любой другой текстовый редактор) надо составить свое CV (резюме)
Требования к оформлению:.
1. Резюме должно занимать ровно 1 страницу и иметь четкую структуру (а не быть сплошным текстом)
2. В верхней части файла указать ваше Имя, Фамилию, контактные данные, можно добавить фотографию
3. Основная часть резюме должна состоять минимум из 4 разделов.
Примеры разделов:
- образование
- достижения (грамоты, сертификаты, дополнительные курсы)
- владение иностранными языками
- опыт работы (если есть)
- профессиональные навыки
- личные качества и увлечения
(Можно придумать другие варианты)
4. Каждый раздел должен содержать заголовок и несколько подпунктов.
5. Разделы отделить друг от друга отступами или горизонтальными линиями
6. Хотя бы один раздел должен содержать две колонки. Например:
- период обучения – образовательное учреждение
- иностранный язык – уровень владения
7. Готовое резюме надо экспортировать в pdf и загрузить вместе с исходным документом Word на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) в репозиторий с названием hw2
Примеры красивых резюме можно посмотреть здесь (они сделаны не в ворде, но можно постараться сделать так же красиво:)
Домашнее задание 5
Дедлайн 11 марта 2018 23:59.
Важно: После дедлайна работы не принимаются.
Результатом задания должен быть отчёт, сохраненный в PDF! (см. Правила сдачи)
1. Сравните частоту употреблений (ipm) слов "ныне" и "сейчас" в разное время (например, в 18, 19, 20 веках) на основе Национального корпуса русского языка.
С помощью Excel постройте столбчатые диаграммы по частотам употреблений этих слов в 18-20 веках (основной подкорпус). Сравните частоты употреблений в основном и поэтическом подкорпусах. Напишите небольшой отчёт, включите в него иллюстрации и их интерпретацию.
2. Перед Вами несколько диалогов. Могли ли они встретиться в таком виде во времена правления Екатерины Второй?
Подкрепите свои рассуждения данными из Национального корпуса русского языка. Полученные выводы включите в отчёт.
— Отдай! — Пиши пропало. Что пряжка, третьего дня эта поганка у меня с груди звезду Александра Невского уперла! Любит, сволочь, блестящее.
— Ох, ну просто немыслимо! Нет, как можно быть таким лопухом?!
— Я гнева вашего никак не растолкую. Он в доме здесь живет, великая напасть!
3. Бонусное задание. Посмотрите динамику употребления слова "щас" в основном подкорпусе с 1950 года до наших дней, постройте график. Сравните употребление слова "щас" в текстах разных жанров (жанр можно задать при выборе подкорпуса. Включите анализ полученных результатов в отчет.
4. Бонусное задание. Найдите в основном подкорпусе сочетания "литература/культура/искусство/язык + существительное в Р.п" (филологам -- литература, культурологам -- культура, искусствовелам -- искусство, дия - язык), скачайте выдачу в формате Excel (ссылка на скачивание будет в самом низу), отсортируйте строки по столбцу F (там будут существительные в Р.п.) и проанализируйте результаты. Какая литература/культура/искусство/язык упоминается в корпусе чаще всего? Выводы включите в отчет.
Важно! Правила сдачи:
Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw5. Отчёт нужно писать в Word (или любом аналоге), затем конвертировать этот файл в PDF, итоговый файл должен называться ruscorpora_report.pdf. Перед сдачей проверьте, пожалуйста, что иллюстрации, поля и форматирование документа в порядке. Придерживайтесь строгого стиля.
Домашнее задание 6 (NGrams&AntConc)
Дедлайн 9 апреля 2018 23:59.
Важно: После дедлайна работы не принимаются.
Правила сдачи: Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw6. Ответы на задания помещайте в readme.
Useful Tips:
Как сделать скриншот?
1) если у вас Windows, скриншот удобно делать с помощью стандартной программы “Ножницы”
2) если у вас Mac, используйте команду Command+Shift+4: выделите нужную часть экрана (скриншот окажется у вас на рабочем столе).
Как вставить картинку в readme?
Для того, чтобы вставить в readme картинку, вам понадобится ссылка на нее.
Получить ссылку можно в том числе следующим образом:
1) откройте свой репозиторий hw6, выберите upload files. Загрузите картинку со скриншотом.
2) откройте загрузившийся рисунок и скопируйте ссылку из адресной строки. Она должна быть следующего вида:
https://github.com/имя_пользователя/название_репозитория/blob/master/имя_файла.расширение
1. Найдите 10 самых частотных продолжений фразы "due to the". Сделайте скриншот графика и Вашего запроса. Скриншот поместите в ридми. В инструкции по Advanced Usage данный тип поиска называется Wildcard search.
2. Выберите слово, которое может одновременно относиться к 2 или более различным частям речи. Это может быть слово любого языка, представленного в Google Ngrams. Постройте график. На графике должны быть две кривые (или более). Для каждого слова должен был указан частеречный тэг. Сделайте скриншот графика и Вашего запроса. Скриншот поместите в ридми. См. в инструкции часть Part-of-speech Tags.
3. Выберите два синонима: один характерный для британского английского, другой – для американского. Посмотрите в Google Ngrams, действительно ли это так (т.е. действительно ли слова характерны для разных вариантов английского). На графике должно быть четыре кривые: две отражают частотность первого слова в корпусе британского и американского английского, две – частотность второго слова. Сделайте скриншот графика и Вашего запроса. Скриншот поместите в ридми. Какие выводы Вы можете сделать из полученных данных? Приведите Ваши размышления в ридми. См. в инструкции часть Corpora, а также объяснения для corpus selection operator.
AntConc
Суть: Анализ стилистических (языковых) особенностей текста посредством использования программы AntConc.
Используя программу AntConc, сравните текст Л. Толстого «Анна Каренина» и произведение любого современного автора.
Для обоих текстов:
а) Отсортируйте слова по частоте (Word List - Sort by Freq). Какие слова оказались в 5-ке наиболее частотных? Не только назовите конкретные слова, а подумайте, почему они там оказались.
б) Какие слова оказались самыми редкими? Как быстро получить эти результаты? (Выпишите, какие настройки вы использовали)
в) выберите 3 слова и проанализируйте контексты, в которых они используются (Concordance)
г) постройте для них Concordance Plot для каждого слова, проанализируйте функционирование этих слов в разных частях текста
д) выберите по одному слову из каждого текста и составьте для них список биграмм - N-грамм (Clusters/N-gram → min (2) - max (5)?)
е) сделайте вывод об индивидуальных особенностях авторских стилей. Все наблюдения и иллюстрации объедините в отчет в свободной форме.
ж) бонусное задание: воспользуйтесь любой опцией, не указанной выше, которая может сообщить какую-либо дополнительную информацию о тексте.
Домашнее задание 8 (ДИЯ)
Дедлайн 29 апреля 2018 23:59.
Важно: После дедлайна работы не принимаются.
Правила сдачи: Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw8.
1. Постройте ориентированный граф своих друзей, используя приложение.
2. Откройте полученный .gexf файл с помощью gephi
Если не удаётся установить gephi или приложение выдаёт ошибку, ознакомьтесь с этой инструкцией.
3. Измените внешний вид графа: запустите алгоритм укладки (раздел "Window"->"Layout"), подберите оптимальные значения параметров, отредактируйте ширину и цвет ребер графа, цвет и размер узлов.
4. Рассчитайте модулярность графа (раздел "Window"->"Statistics"->"Modularity") и раскрасьте граф по классам модулярности (раздел "Window"->"Appearance"->"Nodes"->"Partition"). Проанализируйте полученный результат: насколько корректные получились сообщества? Соответствуют ли они действительности?
5. Во вкладке "Preview" выберите фон, цвета подписей, размер узлов и.т.д.
6. Выгрузите граф в формате pdf. Файл загрузите в репозиторий.
бонусная часть:
7. Установите "Sigma.js export plugin" ("Tools"->"Plugins"->"Available Plugins").
8. Экспортируйте граф через Sigma.js plugin ("File"->"Export"->"Sigma.js template"). В первой строке необходимо указать директорию, куда граф будет экспортирован. Также укажите в соответствующих полях, что означают узлы, ребра и цвета, добавьте описание. Результатом экспорта является папка network в указанной директории.
9. Загрузите файлы из экспортированной папки network в репозиторий (Файл index.html и другие файлы рядом с ним (то есть все содержимое папки network) должны оказаться в корне репозитория, файл ".gitignore" необязателен!). В настройках репозитория "Settings"->"Github pages" выберите master-ветвь. После нажатия "Save" в этом разделе появится ссылка на github-страницу с графом. Укажите эту ссылку в файле README.md.
Домашнее задание 7
Дедлайн 29 апреля 2018 23:59.
Важно: После дедлайна работы не принимаются.
Правила сдачи: Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw7.
1. Постройте ориентированный граф своих друзей, используя приложение.
2. Откройте полученный .gexf файл с помощью gephi
Если не удаётся установить gephi или приложение выдаёт ошибку, ознакомьтесь с этой инструкцией.
3. Измените внешний вид графа: запустите алгоритм укладки (раздел "Window"->"Layout"), подберите оптимальные значения параметров, отредактируйте ширину и цвет ребер графа, цвет и размер узлов.
4. Рассчитайте модулярность графа (раздел "Window"->"Statistics"->"Modularity") и раскрасьте граф по классам модулярности (раздел "Window"->"Appearance"->"Nodes"->"Partition"). Проанализируйте полученный результат: насколько корректные получились сообщества? Соответствуют ли они действительности?
5. Во вкладке "Preview" выберите фон, цвета подписей, размер узлов и.т.д.
6. Выгрузите граф в формате pdf. Файл загрузите в репозиторий.
бонусная часть:
7. Установите "Sigma.js export plugin" ("Tools"->"Plugins"->"Available Plugins").
8. Экспортируйте граф через Sigma.js plugin ("File"->"Export"->"Sigma.js template"). В первой строке необходимо указать директорию, куда граф будет экспортирован. Также укажите в соответствующих полях, что означают узлы, ребра и цвета, добавьте описание. Результатом экспорта является папка network в указанной директории.
9. Загрузите файлы из экспортированной папки network в репозиторий (Файл index.html и другие файлы рядом с ним (то есть все содержимое папки network) должны оказаться в корне репозитория, файл ".gitignore" необязателен!). В настройках репозитория "Settings"->"Github pages" выберите master-ветвь. После нажатия "Save" в этом разделе появится ссылка на github-страницу с графом. Укажите эту ссылку в файле README.md.
Домашнее задание 8 (Филология)
Дедлайн 03.06.2018 23:59.
Скачайте файл с Повестью Временных Лет.
Летопись необходимо отредактировать следующим образом:
1. Удалить все пустые строки.
2. Найти всех князей и города, имя и название которых оканчивается на "слав". В выдаче должны быть такие слова как "Ярославля, Ростиславъ, Ростиславу, Переяславлъ" и т.п. Но не должно быть "славу, выславше" и т.п.
3. Найти все упоминания Новгорода. Учтите, что написание может быть разным . В выдаче должны быть такие слова как "Новѣгородѣ, Новъгородъ, Новгородцю, Новагорода, Новугороду".
БОНУС: После каждого знака препинания поставить пробел (но выставлять их стоит только если того требуют правила русского языка). Например, надо добавить пробел после двоеточия, точки с запятой, запятой; перед квадратной скобкой должен быть пробел; после точки должен быть пробел, если до нее буква или кавычка, а после нее нет другой точки.
В идеале регулярное выражение должно быть в одну строку, но при необходимости можно использовать несколько.
Важно! Правила сдачи:
Создаем отдельный репозиторий на GitHub.
Под задание нужен отдельный файл в репозитории с именем result.txt, в который вы скопируете летопись после обработки (то есть тот текст, который у вас получился после выполнения всех заданий)
В README.md вы описываете все, что делали:
Использовал регулярное выражение: ... заменил все вхождения на ...
Использовал регулярное выражение: ... Всего упоминаний о князьях нашел: (число)
Использовал регулярное выражение: ... Всего упоминаний Новгорода нашел: (число)
Каждый шаг сопровождаете скриншотами! Чтобы было видно, что искали, на что заменяли.
Домашнее задание 8 (ИИ и Культурологи)
Дедлайн 19 мая 2018 23:59.
Важно: После дедлайна работы не принимаются.
Правила сдачи: Создаем отдельный репозиторий на GitHub (Важно: под тем же самым профилем, под которым Вы сдавали первое дз) с именем hw8.
0. Ознакомьтесь с возможностями популярных конструкторов сайтов Wix, Tilda, ReadyMag.
1. Выберите тему вашего будущего сайта. Это может быть ресурс о каком-либо мероприятии (выставка, концерт, лекция…), направлении в искусстве, интересной фигуре, либо сайт об одном из ваших учебных проектов.
2. Выделите на сайте область About (вкладка/текстовое поле/выпадающее меню), в которой будет рассказано о вашем ресурсе и его цели.
3. Кроме того, на сайте должны присутствовать следующие элементы:
а) Заголовок
б) Несколько страниц
в) Система навигации по разделам сайта
г) Контент: тексты (на каждой странице), картинки (не менее 3 на страницу), видео (опционально)
д) Форма регистрации на мероприятие (опционально)
е) Контакты
ж) Карта (опционально)
Бонус:
а. Используйте в качестве конструктора сайтов Tilda или ReadyMag
б. Адаптируйте дизайн ресурса под мобильные устройства.
Домашнее задание 9 (ДИЯ)
Дедлайн 01.06.2018 23:59.
Скачайте файл с Повестью Временных Лет.
Летопись необходимо отредактировать следующим образом:
1. Удалить все пустые строки.
2. Найти всех князей и города, имя и название которых оканчивается на "слав". В выдаче должны быть такие слова как "Ярославля, Ростиславъ, Ростиславу, Переяславлъ" и т.п. Но не должно быть "славу, выславше" и т.п.
3. Найти все упоминания Новгорода. Учтите, что написание может быть разным . В выдаче должны быть такие слова как "Новѣгородѣ, Новъгородъ, Новгородцю, Новагорода, Новугороду".
БОНУС: После каждого знака препинания поставить пробел (но выставлять их стоит только если того требуют правила русского языка). Например, надо добавить пробел после двоеточия, точки с запятой, запятой; перед квадратной скобкой должен быть пробел; после точки должен быть пробел, если до нее буква или кавычка, а после нее нет другой точки.
В идеале регулярное выражение должно быть в одну строку, но при необходимости можно использовать несколько.
Важно! Правила сдачи:
Создаем отдельный репозиторий на GitHub.
Под задание нужен отдельный файл в репозитории с именем result.txt, в который вы скопируете летопись после обработки (то есть тот текст, который у вас получился после выполнения всех заданий)
В README.md вы описываете все, что делали:
Использовал регулярное выражение: ... заменил все вхождения на ...
Использовал регулярное выражение: ... Всего упоминаний о князьях нашел: (число)
Использовал регулярное выражение: ... Всего упоминаний Новгорода нашел: (число)
Каждый шаг сопровождаете скриншотами! Чтобы было видно, что искали, на что заменяли.