Описание
«Обработка неструктурированных текстов». Грант Ингерсолл.
Эта книга срывает покров тайны со многих сложных процессов. Нашу эпоху называют информационной, мы просто завалены информацией, но часто затрудняемся с поисками необходимой. В книге представлены методы, которые помогают найти и использовать информацию, которая скрыта в текстовых документах. Автор подробно описывает эффективные инструменты и методы, позволяющие обработать неструктурированные тексты.
Изучив книгу, вы сможете использовать полнотекстовой поиск. Это дает возможность распознавать имена собственные, выполнять кластеризацию, пометки, извлекать информацию и осуществлять автореферирование. В книге рассказывается о фундаментальных принципах и приводятся примеры их реального применения. Книга будет понятна и без знаний по математической статистике и обработке естественных языков. Примеры написаны на языке программирования Java, но идеи можно реализовать и на любом другом языке программирования. Изложение анализа и обработки текста – краткое, практичное, основано на программах с открытым исходным кодом.
<