Strategie
wyszukiwania źródeł sieciowych
Materiał
pomocniczy dla redaktorów BazTOL
Opracowanie:
Lidia Derfert-Wolf, Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy
Współpraca
przy doborze linków: Elżbieta Tomczak, Uniwersytet Technologiczno-Przyrodniczy
w Bydgoszczy
Bydgoszcz,
listopad 2007 r.
Wprowadzenie
Celem niniejszego poradnika jest
wskazanie metod postępowania w trakcie gromadzenia zasobów sieciowych do
kolekcji BazTOL:
·
przeglądanie
witryn/serwisów istotnych dla danej dziedziny wiedzy;
·
przeglądanie
list, grup i forów dyskusyjnych oraz serwisów wiadomości;
·
wyszukiwanie
przy pomocy standardowych i specjalistycznych wyszukiwarek;
·
korzystanie
z tradycyjnych źródeł informacji.
Wyszukiwanie zasobów do kolekcji
BazTOL powinno na wstępie ograniczyć się do stworzenia kolekcji zasadniczej,
czyli indeksowania w pierwszej kolejności najważniejszych zasobów dla danej
dziedziny. W trakcie dodawania kolejnych zasobów należy utrzymywać równowagę
kolekcji, tzn.:
·
zgromadzić
przynajmniej kilka źródeł dla każdej z dziedzin;
·
zawartość
danego działu (liczba podwiązanych zasobów) nie powinna być ani zbyt mała ani
zbyt wielka. Jeśli w dziale jest za dużo zasobów, należy zastanowić się nad
podziałem na kolejne podkategorie.
Przydatne narzędzia i
sposoby postępowania
Redaktorzy BazTOL gromadząc zasoby będą:
·
przeszukiwać/przeglądać
Internet przy pomocy opisanych niżej narzędzi
·
regularnie
monitorować ważne dla ich dziedziny witryny internetowe i inne serwisy, np.
fora dyskusyjne, serwisy wiadomości.
1. Określenie (a później stała modyfikacja) zestawu słów kluczowych:
·
podstawowe
słowa kluczowe i ich odmiany gramatyczne;
·
synonimy,
wyrażenia bliskoznaczne, terminy pokrewne;
·
terminy
węższe;
·
terminy
szersze;
·
odpowiedniki
angielskie (np. do wyszukiwania polskich zasobów w zagranicznych katalogach i
wyszukiwarkach specjalistycznych)
2. Narzędzia do
„zapamiętywania” stron wartych ciągłego monitorowania
·
Zakładki/Ulubione w przeglądarce
·
darmowe
serwisy do zarządzania linkami,
pozwalających na gromadzenie, opisywanie i kategoryzację linków do swoich
ulubionych stron WWW. W ten sposób jesteśmy niezależni od swojego komputera i
możemy „zapamiętać” link z każdego komputera, z którego akurat korzystamy.
·
Elefanta
- http://www.elefanta.pl/
·
Connotea http://www.connotea.org/
Kanały RSS
·
EBIB - http://nowy.ebib.info/index.php
·
Biotechnolog.net - http://biotechnolog.net/
·
Federacja Bibliotek Cyfrowych http://fbc.pionier.net.pl/owoc
Czytniki
wiadomości:
·
programy
do zainstalowania na własnym komputerze
·
w
przeglądarkach (np. Mozilla Firefox) na własnym komputerze
·
sieciowe
agregatory, z których można korzystać z jakiegokolwiek komputera z dostępem do
sieci - http://www.bloglines.com/
Strategie wyszukiwania
zasobów
1. Przeglądanie uznanych witryn i serwisów WWW, najbardziej wiarygodnych w danej
dziedzinie -> wertowanie wykazów przydatnych linków lub rekomendowanych
źródeł
Sposób postępowania:
·
na
początek należy wyszukać/znać/spytać specjalistów o witryny i serwisy
wymienione niżej w tym dziale i najważniejsze dla danej dziedziny;
·
włączyć
w/w zasoby do kolekcji BazTOL, o ile spełniają ustalone kryteria jakości i
doboru źródeł oraz mieszczą się w określonej tematyce; jeśli zasób jest zbyt
ogólny dla danej dziedziny należy go zgłosić osobie odpowiedzialnej za temat
„Źródła ogólne”;
·
zachować
ich adresy w Zakładkach/Ulubionych lub posługując się wskazanymi wyżej
serwisami zarządzania linków;
·
przeglądać
systematycznie w poszukiwaniu nowych źródeł, ze szczególnym uwzględnieniem
działów wymienionych niżej przy każdej z kategorii zasobów.
Do witryn i serwisów, którym należy
poświęcić szczególną uwagę należą:
1.1. strony ekspertów/specjalistów/autorytetów z danej dziedziny, na których zamieszczane są ich
własne prace, ale też często wykazy przydatnych linków
Przykład:
Adam Groble http://adam-grobler.w.interia.pl/
Katarzyna Pluskota – linki http://katarzyna_pluskota.w.interia.pl/linki.html
1.2. witryny instytucji i organizacji
Witryny
te mogą same w sobie stanowić zasób BazTOL oraz mogą zawierać dokumenty warte
zindeksowania w BazTOL:
Ø Witryny szkół wyższych (również
wydziałów, instytutów, katedr, gdzie wykładowcy zamieszczają swoje publikacje
lub tworzą listy przydatnych linków)
Przykład: Instytut Geografii i Rozwoju
Regionalnego Uniwersytetu Wrocławskiego http://www.zzp.geogr.uni.wroc.pl/linki.htm
Ø Instytuty naukowe, jednostki badawczo-rozwojowe,
centra badawcze
Przykład: Centralny ośrodek Badawczo-Rozwojowy
Opakowań http://www.cobro.org.pl/index.htm
Ø Witryny bibliotek z bogatymi
zestawami linków
Przykład:Biblioteka Uniwersytecka we
Wrocławiu http://www.bu.uni.wroc.pl/przydatne/
Ø Towarzystwa naukowe,
naukowo-techniczne, zawodowe
Przykład: Komitet Krystalografii PAN http://komkryst.int.pan.wroc.pl/default.htm
Ø Instytucje rządowe i pozarządowe
Przykład:Krajowa Agencja Poszanowania Energii
http://www.kape.gov.pl/PL/index.phtml
Skąd czerpać adresy stron w/w osób i instytucji/organizacji?
·
Nauka
Polska http://nauka-polska.pl
·
Katalog polskich uczelni wyższych! http://www.edu.info.pl/katalog.szkol.php
·
Wirtualna
Polska - http://katalog.wp.pl/www/Nauka/Stowarzyszenia_Naukowe/
·
HOGA.PL > Nauka
i technika > Instytucje http://katalog.hoga.pl/kategoria.asp?link=Nauka_i_technika:Instytucje
·
Sejm
RP – linki http://www.sejm.gov.pl/linki/linki.html
·
szukaj
w wyszukiwarkach
1.3. portale i witryny tematyczne (wykazy przydatnych linków, organizacje z danej dziedziny,
akty prawne, publikacje, wykazy oprogramowań, „Aktualności” i fora dyskusyjne)
Przykłady:
Ø Tworzywa.com.pl http://tworzywa.com.pl/linki/index_linki.asp
Ø
Teberia http://www.teberia.pl/links.php
1.4. katalogi tematyczne ogólne i katalogi tematyczne w portalach ogólnych
W
w/w katalogach należy odnaleźć właściwą kategorię/kategorie, wybrać przydatne
witryny, a następnie systematycznie przeglądać te kategorie i sprawdzać czy nie
dodano nowych interesujących dla danej dziedziny. Przykładowe kategorie: nauka,
technika, edukacja, komputery, media.
Przykłady:
Ø
DMOZ Open Directory Project http://www.dmoz.org/
Ø Wirtualna Polska – Katalog stron WWW
http://katalog.wp.pl/
1.5 blogi profesjonalistów z danej dziedziny (po ocenie ich jakości!)
Przykłady:
Ø
TechBlog http://techblog.msite.any.pl/
Ø Blog Krzysztofa Urbanowicza … http://mediacafepl.blogspot.com/2006/05/szukam-blogw-eksperckich-w-polsce.html
Ø
elearning blog http://elearning-20.blogspot.com/
Ø Info-Blog (blog o poszukiwaniu
informacji, o interesujących wyszukiwarkach internetowych, katalogach,
aplikacjach Web2.0 i innych bardziej lub mniej użytecznych stronach w Internecie)
http://infopoint.pl/wordpress/
Blogów
szukać można przy pomocy wyszukiwarek, ale efektywniejszym sposobem jest
korzystanie ze specjalistycznych wyszukiwarek samych blogów i ich treści, np.:
Ø
Technorati http://www.technorati.com/
1.6. inne witryny związane tematycznie z serwisem BazTOL lub ogólne
W tej
grupie mogą się znaleźć inne przydatne serwisy, które warto przeglądać od czasu
do czasu w poszukiwaniu przydatnych zasobów. Mogą to być np.:
Ø bazy danych rejestrujące czasopisma
Przykład: Naukowe i fachowe polskie czasopisma
elektroniczne http://www.bg.us.edu.pl/bazy/czasopisma/
Ø zagraniczne serwisy typu subject
gateways, które mogą rejestrować wysokiej jakości polskie zasoby
Przykład: Intute http://www.intute.ac.uk/
Ø inne przykłady:
ATVN
(Akademicka Telewizja Naukowa) http://www.atvn.pl/
Forum
Akademickie http://www.forumakad.pl/ciekawe_linki.html
1. Listy, grupy i fora dyskusyjne i ich archiwa
Listy,
grupy i fora dyskusyjne często zawierają anonse nowych, przydatnych źródeł z
danej dziedziny. Ponadto mogą tez zawierać opinie uczestników dyskusji o tych
źródłach, przydatne dla redaktorów BazTOL. W celu korzystania z tych informacji
można:
Przykłady:
Scientist.pl
http://www.scientist.pl/
(zob. Matematyka teoretyczna – Serwis edukacyjny)
Gazeta.pl
– Forum – Aktualności i Media – Nauka http://forum.gazeta.pl/forum/71,1.html?f=32
Przykładowe wykazy list dyskusyjnych, forów
·
Katalog
Onet (społeczność internetu) http://katalog.onet.pl/4485,spolecznosc-internetu,k.html
·
Google
Grupy dyskusyjne http://groups.google.com/
2. Subskrypcja związanych z tematyką biuletynów, kanałów RSS i innych
publikatorów dostarczanych systematycznie
Przykłady:
·
Newsletter MNiSzW http://www.nauka.gov.pl/mn/index.jsp?layout=mailing&news_cat_id=129&place=Menu03
·
Polski Internetowy Informator Geodezyjny http://www.geodezja.pl/lista/index.html
·
Infomail.pl
(katalog newsletterów i czasopism internetowych, połączony z ich czytnikiem - http://www.infomail.pl/
·
Onet.pl
– newsy - Nauki ścisłe - http://niusy.onet.pl/niusy.html?t=katalog&p=pl.sci.&kat=Nauki%20%B6cis%B3e
·
Gwar
- serwis informacyjny tworzony przez użytkowników - http://www.gwar.pl/ (zob. dział Nauka)
3. Wyszukiwarki ogólne i specjalistyczne
Co to jest
wyszukiwarka?
W znaczeniu
ogólnym wyszukiwarka to oprogramowanie gromadzące w sposób automatyczny
informacje o dokumentach tekstowych oraz plikach zgromadzonych w sieci
(obszarze wyznaczonym dla wyszukiwarki do indeksowania)”. Wyszukiwarki składają
się z:
1) programu penetrującego zasoby sieci (robot, spider, crawler) - program „przeglądający” sieć, wczytujący
dokumenty, indeksujący ich zawartość oraz wszystkie linki, aktualizujący
informacje co jakiś czas;
2) bazy danych (indeksu tych zasobów) - wszystkie dokumenty
i hiperłącza odnalezione przez w/w program;
3) programu przeszukującego bazę z wbudowanym interfejsem
dla użytkownika - program pozwalający na sformułowanie zapytania, wyszukanie
odpowiednich dokumentów w bazie i przedstawienie wyników w charakterystyczny
dla danego systemu sposób.
Schemat działania systemu wyszukiwawczego. Źródło: A. Nowak: http://www.wsti.pl/pokazy_edu_2005/nowak/Wyszukiwarka.pdf
Korzystanie z
wyszukiwarek – zwłaszcza ogólnych, np. Google – nie powinno być podstawową
metodą pracy w gromadzeniu zasobów do kolekcji BazTOL.
Mogą one
jednak stanowić:
·
pomoc
przy wyszukiwaniu witryn do stałego monitorowania i witryn grupujących inne
linki (omówione w p. 1-3)
·
uzupełnienie
przeglądania witryn z p. 1-3
·
wyszukiwanie
bardzo precyzyjnie określonych informacji, np. stron instytucji, organizacji,
osób, czasopism, publikacji albo zagadnień wg szczegółowego zapytania (NIE
„elektrotechnika”)
W
przypadku pytań ogólnych, np. „inżynieria materiałowa”, wyszukiwarki ogólne
dadzą w rezultacie bardzo dużo wyników. Ponadto ich ranking będzie zróżnicowany
w zależności od wyszukiwarki. Niektóre biorą pod uwagę popularność stron
(liczba stron, na których są linki do danej strony, liczba odwiedzin danej
strony poprzez daną wyszukiwarkę), inne – premiują w pierwszym rzędzie
występowanie poszukiwanych słów (w kodzie HTML) w znacznikach meta, polu TITLE,
w nagłówkach i w końcu w tekście strony. Zatem wyszukiwanie zasobów do BazTOL
przy pomocy wyszukiwarek musi być poprzedzone bardzo szczegółowym opracowaniem pytania/pytań.
Szukając
odpowiedzi na pytania ogólne np. „stowarzyszenia naukowe w Polsce” lepiej
zajrzeć najpierw do katalogów
tematycznych http://katalog.interia.pl/.
Jeśli natomiast
spodziewamy się ogromnej liczby odpowiedzi albo wyszukiwanie
za pomocą jednej wyszukiwarki nie daje rezultatów – skorzystajmy z multiwyszukiwarki http://ixquick.com/.
|
Wyszukiwarki |
Katalogi tematyczne |
Multiwyszukiwarki |
Baza danych |
- tworzona
automatycznie - dużo
stron WWW |
- tworzona
przez ludzi -
niewielki rozmiar bazy |
- nie
posiadają bazy danych - korzystają z innych zasobów |
Kiedy korzystać? |
-
wyszukiwanie bardzo specyficznych, szczegółowych informacji np. osób,
instytucji, wydarzeń, produktów -
wyszukiwanie tematów łatwych do jednoznacznego określenia - potrzeba
znalezienia wszystkiego na dany temat, nawet pojedynczych stron |
-
wyszukiwanie ogólnych zagadnień np. biblioteki w Polsce -
wyszukiwanie informacji związanych z problemem, który można opisywać w różny
sposób -
zawierają mniej informacji niż wyszukiwarki, ale lepszej jakości, prawie
zawsze związanych z poszukiwanym tematem |
-
wyszukiwania, w których spodziewana jest bardzo duża liczba dokumentów -
wyszukiwanie za pomocą jednej wyszukiwarki nie daje rezultatów |
Plusy |
baza
danych jest większa i bardziej aktualna |
- łatwe do
korzystania, -
informacje zamieszczone w bazie są recenzowane i indeksowane - gwarantowana
wysoka jakość |
-
akceptują nieścisłe zapytania |
Minusy |
-
niedokładne sposoby indeksowania i wyszukiwania informacji, -
wyszukiwanie relewantnych dokumentów utrudnione |
-
ograniczona liczba dokumentów - recenzowanie i indeksowanie zabiera dużo
czasu, -
niezadowalająca aktualizacja |
- niska
efektywność w przypadku złożonych zapytań |
Wyszukiwanie |
1)
formularz (jeden lub dwa poziomy) do zadawania pytań 2)
podręczny katalog tematyczny |
1)
kategorie tematyczne - przeglądanie, wertowanie 2)
pomocniczy formularz do wyszukiwania wg słów kluczowych |
1)
formularz (jeden lub dwa poziomy zaawansowania) 2)
podręczny katalog tematyczny |
Ogólne metody i techniki wyszukiwawcze
·
operatory
logiczne Boole’a
·
symbole
+ i - przed poszukiwanymi słowami
·
operatory
bliskości – np. NEAR
·
wyszukiwanie całych zdań/wyrażeń
· różne formy gramatyczne - "maskowanie" końcówek, skrócone wersje wyrazów
·
wielkie
i małe litery
Wyszukiwanie wg kryteriów formalnych
Większość stron internetowych posiada określoną strukturę:
adres URL, tytuł, tekst, linki, pliki graficzne. Dla podwyższenia precyzji
wyszukiwania lub specyficznych pytań, większość wyszukiwarek pozwala ograniczyć
poszukiwanie do określonych pól. Stosuje się bezpośrednie umieszczanie nazwy
(skrótu) pola przed poszukiwanym terminem np. na zapytanie chcąc znaleźć strony z terminem elektrotechnika
w adresie URL, zapisujemy url:elektrotechnika
albo inurl:elektrotechnika.
Podobnie można ograniczyć rezultaty do stron opublikowanych w danym języku, np.
wyłącznie polskim, angielskim itp., utrzymywanych na serwerze z określonej
domeny np. edu, gov, org czy dokumentów w określonym formacie, np. PDF, PPT.
Do tego rodzaju poszukiwań zaleca się formularze zaawansowane!!!
Obszary przeszukiwania
Większość wyszukiwarek ogólnych
daje możliwość skierowania pytania do określonych fragmentów sieci (np. WWW,
grupy dyskusyjne, blogi) albo indeksów określonych typów dokumentów (np.
grafika, wideo, mapy). Możliwości te są ujawnione zawsze na stronie głównej –
jako zakładki nad polem do wpisywania haseł w formularzu podstawowym. Należy
jednak pamiętać, że wszystkie te opcje posiadają również swoje formularze
wyszukiwania zaawansowanego i z tych właśnie należy korzystać.
Formularze wyszukiwania zaawansowanego wyszukiwarek:
·
światowej
Google http://www.google.com/advanced_search?hl=pl
·
krajowej
Netsprint http://www.netsprint.pl/serwis/search?adv=1
Podsumowanie:
þ Zanim
przystąpisz do wyszukiwania opracuj strategię, słowa kluczowe i terminy
pokrewne – kartka i ołówek!
þ Opanuj
doskonale kilka najważniejszych wyszukiwarek!
þ Korzystaj
wyłącznie z formularzy zaawansowanych!
þ Nie
poprzestawaj na jednym zestawie pytań – dodawaj inne, zamieniaj, pamiętaj o
odmianach wyrażeń!
þ Dokładnie
formułuj pytanie z wykorzystaniem operatorów logicznych i innych technik!
þ Przeszukując
nowe narzędzie zawsze przeczytaj Pomoc!
þ Specyficzne
opcje różnych wyszukiwarek ulegają stałym zmianom!
þ Brak
rezultatów wyszukiwania? Sprawdź pisownię (błędy literowe!)
þ Wyszukując
myśl też tak jak myśli robot wyszukiwarki!
þ Niektóre
wyszukiwarki udostępniają dodatkowo katalog tematyczny – korzystaj z niego!
þ Indeksy/bazy
danych różnych wyszukiwarek różnią się zawartością – rezultaty wyszukiwania
nigdy nie będą identyczne!
þ Żadna
z wyszukiwarek nie indeksuje całego Internetu!
þ Pamiętaj,
że polskie wyszukiwarki dają nieraz lepsze rezultaty od Google!
Wyszukiwarki specjalistyczne
Wyszukiwarki specjalistyczne
umożliwiają wyszukiwanie w ramach określonej dziedziny (np. technika, sztuka),
formatu plików (np. dźwiękowych, video, *pdf), rodzaju informacji (np. rządowe)
bądź są przeznaczone dla określonej grupy odbiorców (np. wyszukiwarki naukowe).
Mogą też łączyć kilka z tych kryteriów. Ponieważ brak dobrych tego typu
wyszukiwarek krajowych, można korzystać z zagranicznych, które w swoich bazach
danych często zawierają polskie zasoby sieciowe. Należy przedtem zapoznać się z
możliwościami wyszukiwania zaawansowanego i odpowiednio dobierać kryteria
wyszukiwawcze, np. wg języka, kraju. W poniższych przykładach pominięto
narzędzia do wyszukiwania multimediów – omówione w dalszej części.
Przykłady:
·
Google Scholar - http://scholar.google.com .
·
Internet Archive - http://www.archive.org/index.php
·
OpenDOAR - katalog
akademickich repozytoriów http://www.opendoar.org/
Wyszukiwanie zasobów multimedialnych
·
specjalne
opcje standardowych wyszukiwarek – dalej szukaj formularzy wyszukiwania
zaawansowanego!!!
Przykłady:
Ø Exalead - wydzielone obszary przeszukiwania:
grafika, wideo http://www.exalead.com/search
Ø Google Wyszukiwarka grafiki (Google Image Serach) http://images.google.com/ Google Video Polska (Google Video) http://video.google.com/ http://video.google.pl/
Ø
Gooru Grafika
http://www.gooru.pl/obrazki/
Ø
Netsprint Grafika http://www.netsprint.pl/serwis/pictures
·
specjalistyczne
wyszukiwarki multimediów w sieci (wszystkich albo wybranego typu, np. wideo)
Przykłady:
Ø EveryZing (wyszukiwarka plików audio
i wideo oparta na technologii rozpoznawania mowy) http://www.everyzing.com/
Ø Podscope (wyszukiwarka podcastów) http://www.podscope.com/
Ø blinkx - jak mówi o sobie - jest największą
na świecie i najbardziej zaawansowaną wyszukiwarką wideo http://www.blinkx.com/
Ø
searchforvideo (wyszukiwarka wideoklipów z możliwością przeglądania wg
kategorii tematycznych) http://www.searchforvideo.com/
·
kolekcje
wybranego typu multimediów, katalogi tematyczne, repozytoria
Przykłady:
Ø Wirtualny Pilot http://wirtualnypilot.umcs.lublin.pl/index.html
Ø Inne przykłady zob. w dziale Wyszukiwarki specjalistyczne
4. Korzystanie ze źródeł spoza Internetu
Wiedza o wartościowych zasobach sieciowych
nie musi pochodzić wyłącznie z wertowania i przeszukiwania sieci. Należy
również brać pod uwagę:
·
tradycyjne
publikacje, np. czasopisma fachowe, tygodniki, gazety, materiały konferencyjne
– tam publikowane są informacje czy nawet recenzje ważnych dla danej dziedziny
witryn;
·
ulotki,
programy TV;
·
kontakty
osobiste – z użytkownikami, w tym studentami (oni często mają swoje ulubione
serwisy!) i pracownikami naukowymi, którzy mogą mieć ciekawe zasoby w swoich
Zakładkach/Ulubionych (!) albo mogą je polecać studentom jako materiały
dydaktyczne.
Kilka uwag
Pamiętaj:
Ø Internet jest przeładowany różnego
rodzaju informacjami – korzystaj z opisanych na wstępie systemów zarządzania
linkami!
Ø Internet ciągle się zmienia – śledź te
zmiany, ucz się nowych strategii wyszukiwania i dziel się tą wiedzą z innymi
redaktorami!
Ø Dziedziny nauki też się zmieniają –
śledź programy kształcenia, rozmawiaj ze specjalistami!
Ø Korzystaj najpierw z katalogów i serwisów
tematycznych, a potem dopiero wyszukiwarek!
Ø Zanim przystąpisz do
wyszukiwania/przeglądania opracuj strategię, słowa kluczowe i terminy pokrewne
– kartka i ołówek! Dobry plan wyszukiwania jest kluczem do sukcesu przy
przeszukiwaniu sieci Internet!
Dodatkowe wsparcie dla redaktorów
W trakcie rozwoju kolekcji BazTOL
powinno być zapewnione stałe wsparcie dla redaktorów:
Ø materiały nt. strategii wyszukiwania
(metody i techniki zadawania pytań, wykaz przydatnych źródeł do przeszukiwania)
zamieszczane na stronie WWW dostępnej dla redaktorów i stale aktualizowane;
Ø okresowe szkolenia i praktyczne
warsztaty (nowości w Internecie);
Ø
wykorzystanie
listy dyskusyjnej baztol dla
redaktorów w celu dzielenia się wiedzą na temat nowych źródeł i technik
wyszukiwania;
Ø
automatyczne
gromadzenie przez system komputerowy zapytań użytkowników i udostępnianie
wykazów zapytań redaktorom.