Обновлено 30 сентября№ 31035766
№ 31035766
18 октября
Добавить в избранное
Распечатать
Поделиться
Работа в Москве / Вакансии / IT, Интернет, связь, телеком / Программист Python

Программист на python

г.Москва, ул. Зорге, д. 22 к. 1,2
опыт работы от 3 лет, высшее образование, полная занятость
По договорённости
Обязанности:

Наш институт ищет программиста на Python. Вам предстоит разрабатывать автоматизированную систему по сбору, хранению и классификации сотен гигабайт научно-технической информации. И при этом работать с опытными аналитиками.

Чем предстоит заниматься
• Автоматизировать скачивание материалов из различных интернет-источников.
• Парсить и рубрицировать тексты, т. е. относить текст к той ли иной тематике на основе тематических иерархических словарей и тезаурусов, а также выявлять важные сущности (персоны, компании, номера, контакты, деньги и т. п.)
• Интересной задачей так же будет научиться выделять в текстах необходимые технические параметры, заданные в словарях.

- Подробнее о вакансии -

Мы ищем программиста со знанием python, который помог бы нам решить следующие задачи:

1. Автоматизировать загрузку и парсинг текстовых документов,
2. Рубрикация текстов на основе словарей и автоматизации их пополнения (необходимо иметь хотя бы некоторое представление, а желательно и опыт по рубрикации и классификации текстов).
3. Попутно будут более мелкие задачи по парсингу и загрузке в базу данных более-менее структурированных файлов, например, библиографические данные о патентах, научных статьях или денежных затратах.

При этом объемы информации будут измеряться сначала в десятках гигабайт, а потом обязательно перейдем на террабайты.

Цели:
Мы бы хотели попробовать использовать активно развивающийся проект OpenSemanticSearch на python. Там уже есть и поисковик, и веб-интерфейс, и выделение сущностей, и некоторые наработки по тезаурусам и онтологиям. При этом его надо будет доработать под наши конкретные пожелания и попробовать реализовать функцию рубрикации, а не просто фасетного поиска по тезаурусам и онтологиям. Там же есть интерфейс на Django по редактированию словарей и онтологий, но он не такой развитый, как хотелось бы. В проекте есть возможность написания своих плагинов по обработке. Если мы сможем автоматизировать процесс взаимодействия OpenSemanticSearch с хранилищем документов на Alfresco или словарем на Tematres (которые к сожалению написаны не на python), то это будет отличным результатом и сильно поможет аналитикам.

Второй вариант - использовать отдельные экземпляры поисковых движков типа ElasticSearch или Solr для каждой аналитической задачи (тематики исследований). Например использование проектов типа В этом случае необходим Ваш опыт в автоматизации загрузки данных в "поисковые индексы" и создание пользовательского интерфейса для поиска. Например, использование проекта News-please для сбора новостей и организация поиска через ElasticSearch.

Возможность быстрого и удобного наполнения словарей в онлайн-режиме, совмещенная с поиском по ним – это важно для аналитиков. Есть проекты типа Vocbench или Tematres, но для полноценной работы необходимо автоматизировать импорт-экспорт данных в подходящие форматы.

У нас есть еще лицензионный TextAppliance. Если Вы можете помочь нам его задействовать в общем процессе, как один из элементов, то будет тоже здорово. Он уже умеет сам выделять ключевые слова или составлять аннотации, и кое-что еще. И у него вроде как есть свой API.

Или можно написать все с нуля, включая Web-интерфейс для работы с текстовыми документами, поиском, рубрикацией и выделением объектов.

Требования:

• Опыт программирования на Python от 2 лет, базовый опыт фронтенд разработки – HTML, JS, CSS.
• Опыт использования библиотек NLTK и парсинга текстов (желательно также иметь опыт парсинга xml, json, csv, rdf или owl огромных размеров)
• Работа с базами данных, желательно: PostgreSQL, SQLite и MS SQL
• Умение работать не только с компьютером, но и с людьми, понимать их проблемы и самостоятельно формулировать задачи и требования. Постановка задачи может быть не очень четкой, но интересной

Если же Ваша квалификация и опыт позволяют применить собственные наработки – это просто замечательно. Нам нужны креативные люди.

Если Вас это не пугает, а наоборот интересно – вы нам тоже интересны.
Если Вам хочется познакомиться с опытными аналитиками, понять, чем они живут, и что хотят от программистов, а главное помочь им – то мы Вас ждем. Если на собеседовании мы найдем общий язык – то мы не только ждем Вас, но и готовы с радостью принять в нашу небольшую команду.

Условия:

Испытательный срок 3 месяца.
Заработная плата по итогам собеседования
Пятидневная рабочая неделя с 9:00 до 18:00, пятница с 9:00 до 16:45 Варианты удаленной работы/частичной занятости обсуждаются после прохождения испытательного срока.
Оформление по ТК, оплачиваемый отпуск - 28 календарных дней, больничный лист
Полный рабочий день (возможен индивидуальный график)
На территории работодателя
Навыки:
  • Английский язык (технический)

контакты

Войдите для просмотра контактов работодателя

компания

НТИМИ

Клиент SuperJob с 2013 года
Более 100 сотрудников
4 вакансии

похожие вакансии

  • 18 октябряМосква
    от 50 000 
    Должностные обязанности: Разработка Front-end на языка программирования Python+Django + DRF
    Требования: Понимание как всё работает. Начальные знания HTML, SCSS, JavaScript. Желательно умение работать с jQuery. Знание технологии…
    Добавить в избранное
  • 14:35Москва,Волгоградский проспект, Угрешская
    150 000 — 200 000 
    Должностные обязанности: Разработка Web-сервисов и приложений. Проектная работа. Поддержка существующих решений. Разработка Backend/Frontend
    Требования: Приглашаем к себе в команду WEB-Разработчик / Web-программист. Опыт работы. От 3 лет. Уверенное знание и опыт работы с Python…
    Добавить в избранное
  • Должностные обязанности: Разработка и экспертиза архитектуры систем. Формирование требований к разработчикам аппаратной части. Руководство командой…
    Требования: Практический опыт C/С++, SQL. Опыт применения GoLang, Python, JS, Rest API будет являться преимуществом. Знание современных…
    Добавить в избранное
  • Должностные обязанности: О компании. Написание с нуля без использования frameworks и open source нового функционала к существующей платформе на РНР
    Требования: Знание языка программирования PHP на продвинутом уровне. Хорошее знание одного из языков - C++, Golang, Python. Знание react…
    Добавить в избранное
  • Должностные обязанности: Управление группой программистов: постановка и распределение задач, контроль хода выполнения. Разработка скетчей для платформы…
    Требования: Знание Python / С / C++. Опыт работы с платформами Arduino, Raspberry. Опыт web разработки: HTML\CSS, JavaScript. Опыт разработки…
    Добавить в избранное
  • 11:08Москва,Сходненская
    По договорённости
    Должностные обязанности: Разработка скетчей для платформы Arduino. Разработка скриптов для платформы RaspberryPi. Проведение испытаний и отладка загадок…
    Требования: Знание Python / С / C++. Опыт работы с платформами Arduino, Raspberry. Опыт web разработки: HTML\CSS, JavaScript. Опыт разработки…
    Добавить в избранное