|
|
В LEXIS -NEXIS библиотека - это несколько десятков или сотен файлов, объединенных по тематическому признаку. В файл включена информация или из одного информационного источника, например, газета "The New York Times" с 1982 года, или, как в случае файла PROMT, информация из полутора тысяч информационных источников. Границы между файлами или библиотеками размыты, что создает как некоторое неудобство, так и гибкость при работе с системой. Файлы состоят из документов, а те, в свою очередь, из сегментов или параграфов. В QUESTEL-ORBIT нет разделения на библиотеки. Пользователь работает только с файлами. При этом файл в QUESTEL-ORBIT почти всегда содержит практически все информационные источники по проблеме. Например, файл CAS - Chemical Abstract Services включает в себя все статьи, доклады на конференциях, пресс-релизы компаний и тому подобную информацию, связанную с научными и коммерческими вопросами химии. Всего CAS обрабатывает более 9000 информационных источников. В QUESTEL-ORBIT файл состоит из записей. Перечень библиотек, файлов, их полные и сокращенные имена, сведения о том, какого рода информация входит в тот или иной файл, содержатся в специальных справочных руководствах. Эти руководства пользователь получает от компании, с которой он заключил контракт на информационное обслуживание. Рассмотрим теперь последний компонент задания на поиск - поисковый запрос. В поисковом запросе формулируется и записывается по определенным правилам концепция поиска. В общем случае концепция поиска представляет собой достаточно сложное образование. Главным (иногда единственным) элементом концепции поиска и соответственно поискового запроса является ключевое слово или сочетание слов, которые определяют эту концепцию. Слова или их сочетания должны с большой степенью вероятности содержаться в тексте искомого документа. Так, например, запись поискового запроса в виде software инициирует поиск всех документов, содержащих этот термин (software-программное обеспечение), а по запросу lazer (laser) technologies будет осуществляться поиск документов, где упоминаются лазерные технологии. Для того, чтобы составить задание на поиск, необходимо владеть английской терминологией, характерной для данной предметной области, знать точные английские эквиваленты ключевых слов и понятий, которые будут использоваться при поиске необходимой информации. Например, интересуясь такой темой как "запоминающие устройства для ЭВМ" вам надлежит применять термины, принятые в английском языке для этого понятия - "memory" и "storage". При этом следует определиться, какой из них подходит для вашего случая. Точный выбор ключевого слова - непростая задача. В большинство баз данных документы (записи) поступают из многих источников, а в разных регионах (странах) разными авторами публикаций для воспроизведения одного и того же понятия могут быть использованы отличные друг от друга термины. Для облегчения этой задачи в некоторых онлайновых системах (LEXIS-NEXIS) применяются встроенные вспомогательные словари и тезаурусы, в других (QUESTEL-ORBIT) - реализована возможность просмотра словаря файла. Важным инструментом для формулирования поисковой концепции являются знаки логических операций "and" (и - логическое умножение) и "or" (или - логическое сложение), которые служат для соединения двух или нескольких ключевых слов или концепций. Поясним их использование на примерах. Поисковый запрос "small business" (малый бизнес) and "investments" (инвестиции) вызовет поиск документов (записей), в которых упоминаются оба записанных слова. Запрос "small business" and "Petersburg or Moscow" приведет к поиску документов, в которых наряду со словами "малый бизнес" будут также встречаться название городов "Санкт-Петербург" или "Москва". Таким образом, с помощью <and> можно уточнить поиск, сузить его область, а по операции <or> расширить ее. Кроме вышеперечисленных операций <and> и <оr> в поисковых запросах используются и другие средства, например, операция контекстной близости W. Эти операции составляют ядро любой поисковой системы и знание их уже достаточно для решения широкого класса задач. По мере того, как приобретается опыт, можно использовать более сложные элементы поисковых систем, позволяющие различать единственное и множественное число, строчные и заглавные буквы, контролировать частоту появления ключевых слов в документе, проводить статистический анализ и перекрестный поиск. Существуют различные формы поиска: в виде стандартного логического поиска, в режиме меню (ответы на предлагаемые системой вопросы), формулировки задачи на естественном языке (английском), в технике вербальной формулировки задачи (речевой интерфейс). Отметим, что в LEXIS-NEXIS язык поисковой системы достаточно прост, так как большинство файлов являются полнотекстовыми, но требования к корректной формулировке стратегии поиска здесь строже. В QUESTEL-ORBIT большую часть информации составляют патенты, товарные знаки, структурные химические формулы. Файлы обладают более сложной структурой и в целом язык поисковой системы сложней, чем в LEXIS -NEXIS. С другой стороны, он предоставляет пользователю большие возможности (например, средства для статистического анализа найденной информации, перекрестного поиска и т.д.). 1.6.4 Решение задачиСеанс работы в онлайновом режиме начинается с соединения с узлом компьютерной сети, а затем с Host-компьютером выбранной информационной системы. После ввода своего пароля возможен доступ к информационным ресурсам системы. Методы решения задачи в онлайн режиме могут быть различными. Выбор метода зависит как от квалификации и опыта пользователя, так и формы контракта между пользователем и Вендором. Начинающему пользователю рекомендуется следующая простейшая схема. Прежде всего, надо позаботиться о сохранении на винчестере найденных в процессе решения задач документов. Это весьма просто и большинство коммуникационных программ, которые вы получаете при подписании контракта, имеют простые команды, позволяющие сохранять тексты, поступающие к вам на экран компьютера. Затем следует шаг за шагом вводить задания на поиск, которые входят в предварительно составленный стратегический план. Введенное задание на поиск выполняется практически мгновенно. После каждого шага необходимо просмотреть полностью или частично найденные документы и сохранить их у себя на винчестере. Существует также форма сохранения найденных документов без их просмотра на экране компьютера. Это удобно при работе с большими отчетами, длина которых может составлять до нескольких сотен страниц. Отметим, что при этом подходе минимизируется онлайновое время сеанса (иногда весьма дорогое), сама процедура поиска выполняется достаточно быстро. В итоге, после нескольких минут работы в онлайн режиме, можно получить солидную порцию информации, требующую для ее внимательного просмотра и анализа нескольких часов, или даже дней. Просмотрев полученные результаты, можно модифицировать свою стратегию, если она была не очень удачной, составить новый план и новые задания на поиск и повторить описанную выше процедуру в следующем онлайновом сеансе. Как правило, только специалисты, хорошо знающие исследуемую предметную область и четко представляющие себе, какого рода информация им нужна и что является "лишним", могут себе позволить работу в полноценном интерактивном режиме по схеме типа: "запрос - ответ - беглый просмотр и анализ результатов - новый уточненный запрос и т.д.". Иногда решение задачи не приводит к ожидаемому результату - найти нужную информацию не удается. Однако чаще всего это вовсе не свидетельствует об ее отсутствии в БД. Уточнив формулировку, изменив подход к решению задачи, скорректировав стратегию поиска, можно выйти на искомую информацию. В любом случае очевидно, что результативность, точность решения, затраченные время и средства, в конечном счете, определяются опытом и знаниями пользователя, его способностью квалифицированно сформулировать задачу, умением ориентироваться в информационном пространстве, навыками построения грамотной стратегии поиска, анализа получаемой информации. |
Новости |
Мои настройки |
|
© 2009 Все права защищены.