Автор - из Научно-исследовательского университета МЭИ. Полное название сообщения: "Патентная контентная информация (знания): результат прошлых достижений и прообраз будущего технологического развития. Особенности и перспективы изучения
Одной из наиболее важных и актуальных современных глобальных проблем информации является проблема BIGDATA(огромные объемы данных). Выражение BIG DATA относится к большим, разнообразным, сложным, распределенным наборам данных, полученных от приборов, датчиков, посредством транзакций через сеть Интернет, электронной почты, из видеоматериалов, и всех других цифровых источников информации, доступных сегодня и в будущем.
BIG DATA представляет беспрецедентные возможности для ускорения научных открытий и инноваций, обнаружения новых областей исследований, недоступных с помощью других средств, улучшения процесса принятия решений, понимания сущности человека и социальных процессов, осуществления экономического роста, улучшения здоровья и качества жизни (Висант Хонавар, 2012, Национальный Научный Фонд США).
Сложность проблемы характеризуется следующими факторами: возможности по сбору большого объема данных превышают возможности по их хранению; многие наборы данных слишком большие, чтобы их скачать; многие их них слабо организованы для использования; они разнородны по типам, структуре, семантике и доступности; полезность таких данных ограничена нашей способностью их интерпретировать и использовать.
Патент как один из видов информационных элементов является наилучшим индикатором инновационного технологического развития. Анализ патентов позволяет выявлять зарождение новых перспективных технологий, направления и темпы их развития. В патентных фондах по существу отражена вся история технологического развития человечества.
В фонде Ведомства по патентам и товарным знакам США содержится свыше 8428000 патентов. Эта база данных высоко организована, структурирована, классифицирована согласно Национальной и Международной патентной классификации, доступна удаленным пользователям по каналам связи для проведения поиска. Она, действительно, является уникальным источником технологических знаний практически во всех известных областях.
Однако для эффективного использования патентной информации нужно решить две принципиальные проблемы: проблему поиска и выявления из огромного массива данных всех релевантных запросу патентов и проблему извлечения знаний из текстов и рисунков в найденных патентах.
Это – типичные проблемы поиска и обработки информации в огромных массивах данных, то есть из области BIG DATA.
В рамках разворачивающегося сейчас в МЭИ междисциплинарного научного исследования решались две задачи: выявление знаний, содержащихся в патентах в области радиотехники, и генерация новых знаний для создания новых эффективных технологических решений.
Введено понятие "патентные контентные знания" как знания, содержащиеся в полном описании патента в виде текста и рисунков. С использованием временных рядов определена динамика развития интересующей области. Применялись разные технологии извлечения знаний из текста. Предложен новый подход, в котором известное понятие «патентная семья» (патент вместе с указанными в нем аналогами) развито до уровня технологического рода и технологической популяции по аналогии с живой природой. Это позволило значительно повысить точность поиска и уменьшить размерность получаемого массива патентов. Введенное понятие «технологический ген» использовано при генерировании новых знаний.
Исследования проводились как для англоязычного, так и для русскоязычно массивов патентов в области радиотехники. В качестве источников патентов использовались фонды Ведомства по патентам и товарным знакам США и Всероссийской патентно-технической библиотеки.
|
Комментарий ведущего Сетевого Круглого Стола
Всего доброго! vann1936 (для друзей ВВ)
Патенты как источник образования человека в ХХ1 в.?
Кладезь-свалка Интернет... Отбор достоверных источников - одна из главных проблем для искателя в Интернет. Патенты, включенные в информационные базы после тщательной экспертизы, "снимают" проблему достоверности?
Насколько знаю, поиск по патентам сегодня - удел специалистов. А есть ли сегодня в МЭИ практика поиска по патентным базам в учебных курсах для студентов?
Кроме этого вопроса по теме Круглого Стола "Информационная наука -образованию в ХХ1 в.", есть и вопросы по тексту:
Жаль, что нет ссылок на ресурсы в Интернет. (в т.ч. на фонд Ведомства по патентам и товарным знакам США). Кстати, база открыта для поиска, а есть ли доступ к содержанию отобранных патентов:
Всего доброго! vann1936 (для друзей ВВ)