EasyLaw (командный проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м
 
(не показано 8 промежуточных версии 2 участников)
Строка 6: Строка 6:
 
|number_of_students=2
 
|number_of_students=2
 
|categorize=yes
 
|categorize=yes
 +
|is_archived=yes
 
}}
 
}}
  
 
=== Что это за проект? ===
 
=== Что это за проект? ===
Суть проекта заключается в создании онлайн сервиса автоматической проверки договора путем применения технологии распознавания и обработки естественного языка. Конечный продукт будет представлять собой платный онлайн-сервис автоматической юридической проверки договора на юридические риски и распознавание иных необходимых условий. Промежуточным этапом данного продукта является создание MVP, который представляет собой онлайн-сервис автоматизированной проверки договора. Алгоритм обработки юридического текста будет определять стоимость и время проверки за счет анализа ряда параметров загруженного текста (количество слов, вид и стороны договора, автоматически обнаруженные риски). Полноценная юридическая экспертиза будет выполняться профессиональным юристом. Документ будет загружаться через сайт в любом формате, вначале осуществляется распознавание текста целиком и количества слов через технологии OCR, затем - семантическое распознавание. MVP после запуска будет обновляться и выполнять все больше операций по юридической проверке документа автоматически.
+
Облачный сервис для юристов, который формирует пакеты документов для юридических действий (регистрация товарного знака, внесение изменений в ООО, заключение договора). Наш продукт экономит 30-50% времени юриста и исключает вероятность ошибки. Сервис ведет базу клиентов юриста, пользовательских шаблонов и предлагает готовые пакеты документов. Например, пакет документов для защиты персональных данных в рамках Закона “О персональных данных”.
 
+
Продукт нацелен на аудитории малого бизнеса, в том числе, индивидуальных предпринимателей, ООО, а также физических лиц (потребителей). Указанные субъекты, как правило, не используют услуги юристов или юридических фирм на постоянной основе. Наше конкурентное преимущество заключается в том, что мы демонстрируем прозрачное ценообразование и конкурентную стоимость услуги, а также гибкий функционал юридической экспертизы договора и высокую скорость работы профессиональных юристов, а к июню-декабрю 2017 алгоритм будет монетизироваться за счет полностью автоматической проверки договоров.
+
  
 
=== Чему научатся студенты? Что самое интересное в проекте? ===
 
=== Чему научатся студенты? Что самое интересное в проекте? ===
 
Yandex Mystem
 
Yandex Mystem
 
scikit-learn
 
scikit-learn
ABBYY Compreno
+
html
ABBYY OCR
+
css
OCR.space
+
javascript
 +
ajax
 +
jquery
 +
технологии машинного обучения
  
 
=== Организация работы (Как студенты будут работать в команде?) ===
 
=== Организация работы (Как студенты будут работать в команде?) ===
 
2 студента.
 
2 студента.
 +
 
Обязанности будут распределяться равномерно по двум направлениям:
 
Обязанности будут распределяться равномерно по двум направлениям:
 +
 
1. Работа с извлечением данных из текста и NLP.
 
1. Работа с извлечением данных из текста и NLP.
 +
 
2. Развитие функционала веб-приложения.
 
2. Развитие функционала веб-приложения.
  
Строка 33: Строка 38:
 
=== Какие будут использоваться технологии? ===
 
=== Какие будут использоваться технологии? ===
 
Студенты научатся:
 
Студенты научатся:
- обрабатывать текст на разных уровнях препроцессинга (токенизация, pos-tagging, разбиение на предложения)
+
- обрабатывать текст на разных уровнях препроцессинга (токенизация, pos-tagging, разбиение на предложения)
- работать с сервером через ssh; работать в командной строке Linux
+
 
- работать с приложениями посредством REST API
+
- работать с сервером через ssh; работать в командной строке Linux
- работать с бэкендом на Django/Flask
+
 
- писать фронтенд, используя современные фреймворки и технологии (Bootstrap/JQuery и т.п.)
+
- работать с приложениями посредством REST API
- работать с системой контроля версий git
+
 
- покрывать код тестами
+
- работать с бэкендом на Django/Flask
 +
 
 +
- писать фронтенд, используя современные фреймворки и технологии (Bootstrap/JQuery и т.п.)
 +
 
 +
- работать с системой контроля версий git
 +
 
 +
- покрывать код тестами
  
 
=== Какие начальные требования? ===
 
=== Какие начальные требования? ===
знания Python
+
- знания Python
начальные знания HTML, CSS
+
 
инициативность в решении задач разработки
+
- начальные знания HTML, CSS
желательно и очень приветствуется: знание JavaScript, Django/Flask, работа с REST API, NLP, scikit-learn
+
 
или желание во всем этом разбираться
+
- инициативность в решении задач разработки
 +
 
 +
- желательно и очень приветствуется: знание JavaScript, Django/Flask, работа с REST API, NLP, scikit-learn
 +
 
 +
- или желание во всем этом разбираться
  
 
=== Темы вводных занятий ===
 
=== Темы вводных занятий ===
 
1. Общее описание технологий NLP и алгоритмов машинного обучения.
 
1. Общее описание технологий NLP и алгоритмов машинного обучения.
 +
 
2. Методология работы с данными для решения задач проекта по обработке юридического текста договоров.
 
2. Методология работы с данными для решения задач проекта по обработке юридического текста договоров.
 +
 
3. Характеристики технологий, которые мы используем для решения задач семантического распознавания текста.
 
3. Характеристики технологий, которые мы используем для решения задач семантического распознавания текста.
  
 
=== Критерии оценки ===
 
=== Критерии оценки ===
 
В части работы по извлечению данных и NLP:
 
В части работы по извлечению данных и NLP:
 +
 
4-5:
 
4-5:
 
создать модуль препроцессинга текста
 
создать модуль препроцессинга текста
 +
 
6-7:
 
6-7:
 
улучшать работу сплиттера предложений
 
улучшать работу сплиттера предложений
 +
 
8-10
 
8-10
 
готовый хорошо работающий модуль препроцессинга;
 
готовый хорошо работающий модуль препроцессинга;
Строка 64: Строка 84:
  
 
В части web:
 
В части web:
 +
 
4-5:
 
4-5:
 
развитие функционала веб-приложения
 
развитие функционала веб-приложения
 +
 
6-7:
 
6-7:
 
разработка модуля хранения и передачи документов клиента  
 
разработка модуля хранения и передачи документов клиента  
 +
 
8-10:
 
8-10:
 
добавление платежки в веб-приложение.
 
добавление платежки в веб-приложение.

Текущая версия на 12:59, 8 октября 2017

Компания EasyLaw
Учебный семестр Осень 2016
Учебный курс 3-й курс
Максимальное количество студентов, выбравших проект: 2


Внимание! Данный проект находится в архиве и реализован не будет.

Что это за проект?

Облачный сервис для юристов, который формирует пакеты документов для юридических действий (регистрация товарного знака, внесение изменений в ООО, заключение договора). Наш продукт экономит 30-50% времени юриста и исключает вероятность ошибки. Сервис ведет базу клиентов юриста, пользовательских шаблонов и предлагает готовые пакеты документов. Например, пакет документов для защиты персональных данных в рамках Закона “О персональных данных”.

Чему научатся студенты? Что самое интересное в проекте?

Yandex Mystem scikit-learn html css javascript ajax jquery технологии машинного обучения

Организация работы (Как студенты будут работать в команде?)

2 студента.

Обязанности будут распределяться равномерно по двум направлениям:

1. Работа с извлечением данных из текста и NLP.

2. Развитие функционала веб-приложения.

Компоненты (Из каких частей состоит проект?)

1. Создание прототипа, обрабатывающего вышеуказанные параметры текста договора и определяющие время и стоимость проверки - ноябрь 2016г.

2. Обновление алгоритма, автоматическое распознавание юридических рисков в договоре - январь - декабрь 2017г.

Какие будут использоваться технологии?

Студенты научатся: - обрабатывать текст на разных уровнях препроцессинга (токенизация, pos-tagging, разбиение на предложения)

- работать с сервером через ssh; работать в командной строке Linux

- работать с приложениями посредством REST API

- работать с бэкендом на Django/Flask

- писать фронтенд, используя современные фреймворки и технологии (Bootstrap/JQuery и т.п.)

- работать с системой контроля версий git

- покрывать код тестами

Какие начальные требования?

- знания Python

- начальные знания HTML, CSS

- инициативность в решении задач разработки

- желательно и очень приветствуется: знание JavaScript, Django/Flask, работа с REST API, NLP, scikit-learn

- или желание во всем этом разбираться

Темы вводных занятий

1. Общее описание технологий NLP и алгоритмов машинного обучения.

2. Методология работы с данными для решения задач проекта по обработке юридического текста договоров.

3. Характеристики технологий, которые мы используем для решения задач семантического распознавания текста.

Критерии оценки

В части работы по извлечению данных и NLP:

4-5: создать модуль препроцессинга текста

6-7: улучшать работу сплиттера предложений

8-10 готовый хорошо работающий модуль препроцессинга; работа с извлечением данных из текста.

В части web:

4-5: развитие функционала веб-приложения

6-7: разработка модуля хранения и передачи документов клиента

8-10: добавление платежки в веб-приложение.

Похожие проекты

Похожими проектами являются:

Россия: Сервис "Электронный юрист" от компании "Система Юрист" и "Актион" (https://dogovor.1jur.ru/#/).

США: LawGeex (www.lawgeex.com), KiraSystems (www.kirasystems.com), Beagle (www.beagle.ai).

Контактная информация

+7(906)032-63-56 Григорий Игнатьев