EasyLaw (командный проект) — различия между версиями
м |
м |
||
Строка 9: | Строка 9: | ||
=== Что это за проект? === | === Что это за проект? === | ||
− | Суть проекта заключается в создании онлайн сервиса автоматической проверки договора путем применения технологии распознавания и обработки естественного языка. Конечный продукт будет представлять собой платный онлайн-сервис автоматической юридической проверки договора на юридические риски и распознавание иных необходимых условий. Промежуточным этапом данного продукта является создание MVP, который представляет собой онлайн-сервис автоматизированной проверки договора. Алгоритм обработки юридического текста будет определять стоимость и время проверки за счет анализа ряда параметров загруженного текста (количество слов, вид и стороны договора, автоматически обнаруженные риски). Полноценная юридическая экспертиза будет выполняться профессиональным юристом. Документ будет загружаться через сайт в любом формате, вначале осуществляется распознавание текста целиком и количества слов через технологии OCR, затем - семантическое распознавание. MVP после запуска будет обновляться и выполнять все больше операций по юридической проверке документа автоматически. | + | Суть проекта заключается в создании онлайн сервиса автоматической проверки договора путем применения технологии распознавания и обработки естественного языка. Конечный продукт будет представлять собой платный онлайн-сервис автоматической юридической проверки договора на юридические риски и распознавание иных необходимых условий. Промежуточным этапом данного продукта является создание MVP (), который представляет собой онлайн-сервис автоматизированной проверки договора. Алгоритм обработки юридического текста будет определять стоимость и время проверки за счет анализа ряда параметров загруженного текста (количество слов, вид и стороны договора, автоматически обнаруженные риски). Полноценная юридическая экспертиза будет выполняться профессиональным юристом. Документ будет загружаться через сайт в любом формате, вначале осуществляется распознавание текста целиком и количества слов через технологии OCR, затем - семантическое распознавание. MVP после запуска будет обновляться и выполнять все больше операций по юридической проверке документа автоматически. |
Продукт нацелен на аудитории малого бизнеса, в том числе, индивидуальных предпринимателей, ООО, а также физических лиц (потребителей). Указанные субъекты, как правило, не используют услуги юристов или юридических фирм на постоянной основе. Наше конкурентное преимущество заключается в том, что мы демонстрируем прозрачное ценообразование и конкурентную стоимость услуги, а также гибкий функционал юридической экспертизы договора и высокую скорость работы профессиональных юристов, а к июню-декабрю 2017 алгоритм будет монетизироваться за счет полностью автоматической проверки договоров. | Продукт нацелен на аудитории малого бизнеса, в том числе, индивидуальных предпринимателей, ООО, а также физических лиц (потребителей). Указанные субъекты, как правило, не используют услуги юристов или юридических фирм на постоянной основе. Наше конкурентное преимущество заключается в том, что мы демонстрируем прозрачное ценообразование и конкурентную стоимость услуги, а также гибкий функционал юридической экспертизы договора и высокую скорость работы профессиональных юристов, а к июню-декабрю 2017 алгоритм будет монетизироваться за счет полностью автоматической проверки договоров. | ||
Строка 34: | Строка 34: | ||
Студенты научатся: | Студенты научатся: | ||
- обрабатывать текст на разных уровнях препроцессинга (токенизация, pos-tagging, разбиение на предложения) | - обрабатывать текст на разных уровнях препроцессинга (токенизация, pos-tagging, разбиение на предложения) | ||
+ | |||
- работать с сервером через ssh; работать в командной строке Linux | - работать с сервером через ssh; работать в командной строке Linux | ||
+ | |||
- работать с приложениями посредством REST API | - работать с приложениями посредством REST API | ||
+ | |||
- работать с бэкендом на Django/Flask | - работать с бэкендом на Django/Flask | ||
+ | |||
- писать фронтенд, используя современные фреймворки и технологии (Bootstrap/JQuery и т.п.) | - писать фронтенд, используя современные фреймворки и технологии (Bootstrap/JQuery и т.п.) | ||
+ | |||
- работать с системой контроля версий git | - работать с системой контроля версий git | ||
+ | |||
- покрывать код тестами | - покрывать код тестами | ||
=== Какие начальные требования? === | === Какие начальные требования? === | ||
знания Python | знания Python | ||
− | начальные знания HTML, CSS | + | |
− | инициативность в решении задач разработки | + | - начальные знания HTML, CSS |
− | желательно и очень приветствуется: знание JavaScript, Django/Flask, работа с REST API, NLP, scikit-learn | + | |
− | или желание во всем этом разбираться | + | - инициативность в решении задач разработки |
+ | |||
+ | - желательно и очень приветствуется: знание JavaScript, Django/Flask, работа с REST API, NLP, scikit-learn | ||
+ | |||
+ | - или желание во всем этом разбираться | ||
=== Темы вводных занятий === | === Темы вводных занятий === |
Версия 15:50, 3 октября 2016
Компания | EasyLaw |
Учебный семестр | Осень 2016 |
Учебный курс | 3-й курс |
Максимальное количество студентов, выбравших проект: 2 | |
Содержание
|
Что это за проект?
Суть проекта заключается в создании онлайн сервиса автоматической проверки договора путем применения технологии распознавания и обработки естественного языка. Конечный продукт будет представлять собой платный онлайн-сервис автоматической юридической проверки договора на юридические риски и распознавание иных необходимых условий. Промежуточным этапом данного продукта является создание MVP (), который представляет собой онлайн-сервис автоматизированной проверки договора. Алгоритм обработки юридического текста будет определять стоимость и время проверки за счет анализа ряда параметров загруженного текста (количество слов, вид и стороны договора, автоматически обнаруженные риски). Полноценная юридическая экспертиза будет выполняться профессиональным юристом. Документ будет загружаться через сайт в любом формате, вначале осуществляется распознавание текста целиком и количества слов через технологии OCR, затем - семантическое распознавание. MVP после запуска будет обновляться и выполнять все больше операций по юридической проверке документа автоматически.
Продукт нацелен на аудитории малого бизнеса, в том числе, индивидуальных предпринимателей, ООО, а также физических лиц (потребителей). Указанные субъекты, как правило, не используют услуги юристов или юридических фирм на постоянной основе. Наше конкурентное преимущество заключается в том, что мы демонстрируем прозрачное ценообразование и конкурентную стоимость услуги, а также гибкий функционал юридической экспертизы договора и высокую скорость работы профессиональных юристов, а к июню-декабрю 2017 алгоритм будет монетизироваться за счет полностью автоматической проверки договоров.
Чему научатся студенты? Что самое интересное в проекте?
Yandex Mystem scikit-learn ABBYY Compreno ABBYY OCR OCR.space
Организация работы (Как студенты будут работать в команде?)
2 студента. Обязанности будут распределяться равномерно по двум направлениям: 1. Работа с извлечением данных из текста и NLP. 2. Развитие функционала веб-приложения.
Компоненты (Из каких частей состоит проект?)
1. Создание прототипа, обрабатывающего вышеуказанные параметры текста договора и определяющие время и стоимость проверки - ноябрь 2016г.
2. Обновление алгоритма, автоматическое распознавание юридических рисков в договоре - январь - декабрь 2017г.
Какие будут использоваться технологии?
Студенты научатся:
- обрабатывать текст на разных уровнях препроцессинга (токенизация, pos-tagging, разбиение на предложения)
- работать с сервером через ssh; работать в командной строке Linux
- работать с приложениями посредством REST API
- работать с бэкендом на Django/Flask
- писать фронтенд, используя современные фреймворки и технологии (Bootstrap/JQuery и т.п.)
- работать с системой контроля версий git
- покрывать код тестами
Какие начальные требования?
знания Python
- начальные знания HTML, CSS
- инициативность в решении задач разработки
- желательно и очень приветствуется: знание JavaScript, Django/Flask, работа с REST API, NLP, scikit-learn
- или желание во всем этом разбираться
Темы вводных занятий
1. Общее описание технологий NLP и алгоритмов машинного обучения. 2. Методология работы с данными для решения задач проекта по обработке юридического текста договоров. 3. Характеристики технологий, которые мы используем для решения задач семантического распознавания текста.
Критерии оценки
В части работы по извлечению данных и NLP: 4-5: создать модуль препроцессинга текста 6-7: улучшать работу сплиттера предложений 8-10 готовый хорошо работающий модуль препроцессинга; работа с извлечением данных из текста.
В части web: 4-5: развитие функционала веб-приложения 6-7: разработка модуля хранения и передачи документов клиента 8-10: добавление платежки в веб-приложение.
Похожие проекты
Похожими проектами являются:
Россия: Сервис "Электронный юрист" от компании "Система Юрист" и "Актион" (https://dogovor.1jur.ru/#/).
США: LawGeex (www.lawgeex.com), KiraSystems (www.kirasystems.com), Beagle (www.beagle.ai).
Контактная информация
+7(906)032-63-56 Григорий Игнатьев