Путь человека труден и опасен, но мы преодолеем всё и доберёмся до конечной точки нашего пути – Вершине знаний.

Специалисты в области информации, при написании рефератов, идут другим путем.



Специалисты в области информации, при написании рефератов, идут другим путем.
Специалисты в области информации, при написании рефератов, идут другим путем.

Если современные программы пока не могут творчески переработать написанный человеком текст, они бесспорно способны его сокращать — в 5—6 раз. Это еще не истинный реферат, но, согласитесь, немалое подспорье в информационном деле.

Кстати, авторы научных статей могут оказать машинам (да и всем тем, кто планирует заказ курсовых рефератов в Санкт-Петербурге тоже) неоценимую услугу — писать короче, яснее, без лишних слов.


Специалисты в области информации, не обольщаясь по части творческих возможностей машин, при написании рефератов, идут другим путем.


Посмотрим же, как компьютер решает такую задачу. Прежде всего, машина определяет информационный вес, или смысловую значимость, каждого предложения. Этот параметр складывается из так называемых информационных весов слов, входящих в рассматриваемое предложение.


Наибольшие веса придаются терминам, которые в виде словаря по нужной тематике закладываются в память машины, а также словам (существительным и прилагательным), которые чаще встречаются в тексте. В зависимости от тематической направленности реферата — грубо говоря, от того, для кого он составляется, — один и тот же термин может иметь разные веса.



Между прочим, такой словарь терминов с их весами строится автоматически: машине дают «читать» предшествующую литературу по тем вопросам, в которых она будет потом выступать в качестве референта, и программа сама отбирает, наиболее употребительные термины и определяет значимость каждого из них.


Правда, при таком подсчете в числе наиболее важных слов статьи может оказаться просто любимое словечко автора. Но тут уж ничего не поделаешь. Надо следить за тем, что говоришь и пишешь...


Вес предложения, оцененный по весам слов, уточняется. Сначала машина прикидывает, насколько важен абзац, в который входит рассматриваемая фраза. А важность абзаца также оценивается по тому, насколько часто в нем использованы основные термины и понятия. Наконец, машина прикидывает, как соответствует каждое предложение названию статьи, а значит, и ее содержанию.


Информационный вес предложения служит своеобразным фильтром: оставить фразу в реферате или выкинуть. Задавая машине разные пороги информативности, можно получать рефераты подробней или короче. Выбор важнейших ключевых предложений, которые составляют реферат, как мы убедились, сравнительно несложная задача. Значительно труднее сохранить, выбрасывая фразы, структуру текста, семантическую связанность.


Чтобы реферат не был бессмысленным и бессвязным набором слов, машина руководствуется важным правилом: каждый последующий элемент несет новую информацию, дополняющую и развивающую уже сказанное. Другими словами, смысл соседних предложений должен быть близким, схожим. Но как программа этот смысл уловит?


Здесь составители алгоритмов пользуются эффективным формальным приемом: Грубо говоря, вводятся специальные меры (величины) повторяемости слов в смежных предложениях. После вычисления этих мер, машина решает, могут ли два предложения стоять в реферате рядом.


Пользуясь таким приемом, можно получить довольно связные рефераты. Что же касается лишних слов и словосочетаний, то с этим пока ничего нельзя сделать: машина, как уже говорилось, научена сокращать по предложениям, а не по словам.


__________________________





Все материалы взяты из открытых источников и представлены исключительно в ознакомительных целях. Все права на книги принадлежат их авторам и издательствам.



Вход в систему