WSTĘP
WYSZUKIWANIE INFORMACJI W SIECI ROZLEGŁEJ: KATALOGI STRON WWW A WYSZUKIWARKI INTERNETOWE
CEL I STRUKTURA PRACY

ZWIĄZKI NLP Z INFORMACJĄ NAUKOWĄ
1.1. WPROWADZENIE TEORETYCZNE DO PRZETWARZANIA JĘZYKA NATURALNEGO
1.2.1. Ustalenia terminologiczne związane z nazwą badań nad tekstami języka naturalnego
1.2. WYBRANE KIERUNKI BADAWCZE
1.2.1. Wyszukiwanie informacji w dokumentach
1.2.2. Grupowanie dokumentów (klasteryzacja)
1.2.2.1. Grupowanie oparte o wzorce
1.2.2.2. Grupowanie bezwzorcowe

USTALENIA TERMINOLOGICZNE ORAZ WYBRANE METODY KOMPUTEROWEGO PRZETWARZANIA JĘZYKA NATURALNEGO
2.1. TERMINY PRZYJĘTE W KSIĄŻCE
2.2. ANALIZA KWANTYTATYWNA TEKSTÓW
2.2.1. Jednostki badania kwantytatywnego tekstów
2.2.2. Cechy statystyczne jednostek leksykalnych
2.2.3. Zależności leksykalne
2.3. WYBRANE METODY REPREZENTACJI TREŚCI DOKUMENTÓW
2.3.1. Zbiór słów (bag-of-words)
2.3.2. Listafrekwencyjna
2.3.3. Reprezentacja wektorowa
2.4. WYBRANE SPOSOBY OKREŚLANIA WAGI SŁÓW
2.5. OPTYMALIZACJA LINGWISTYCZNA TREŚCI DOKUMENTU
2.5.1. Przygotowanie dokumentów do indeksowania treści
2.5.2. Usunięcie wyrazów mało znaczących
2.5.3. Wyznaczanie rdzenia wyrazu
2.5.3.1. Metody wskazywania wspólnego rdzenia
2.5.4. Wskazywanie lematu słowoformy

ZASADY POSTĘPOWANIA BADAWCZEGO I OPIS PRZYGOTOWANEGO SYSTEMU
3.1. PRZEDMIOT, CEL I METODOLOGIA BADAŃ
3.1.1. Przedmiot badań
3.1.2. Cele i hipotezy badawcze
3.2. ZASTOSOWANE METODY, TECHNOLOGIE I NARZĘDZIA BADAWCZE
3.2.1. Zastosowane technologie
3.2.2. Język Python
3.3. ORGANIZACJA I PRZEBIEG BADAŃ
3.3.1. Przygotowanie dokumentów do analizy
3.3.2. Klasyfikacja zawartości pliku
3.3.3. Usunięcie wyrazów nierelewantnych
3.3.4. Ustalenie podstawowej postaci wyrazów
3.3.5. Zliczenie wystąpień danego słowa
3.3.6. Analiza słów wyróżnionych
3.3.7. Metody ustalania wagi słów
3.3.8. Porównanie zestawów słów kluczowych ustalanych tradycyjnie i automatycznie
3.4. PREZENTACJA MATERIAŁU BADAWCZEGO
3.4.1. Korpus tekstów
3.4.2. Teksty z zakresu informacji naukowej i bibliologii
3.4.2.1. Artykuły z czasopism
3.4.2.2. Artykuły z materiałów konferencyjnych
3.4.3. Subkorpus ekonomia i zarządzanie
3.4.4. Słowa kluczowe
3.4.4.1. Słowa kluczowe wybierane przez autorów
3.4.4.2. Słowa kluczowe wskazane przez indeksatorów
3.4.4.3. Słowa kluczowe generowane automatycznie

ANALIZA ORAZ INTERPRETACJA MATERIAŁU BADAWCZEGO I WYNIKÓW BADAŃ
4.1. ANALIZA GŁÓWNEGO KORPUSU TEKSTÓW
4.1.1. Czasopisma
4.1.2. Materiały konferencyjne
4.1.3. Analiza całego korpusu
4.2. ANALIZA KORPUSU POMOCNICZEGO
4.3. SŁOWA KLUCZOWE UZYSKANE W WYNIKU INDEKSOWANIA TRADYCYJNEGO I AUTOMATYCZNEGO
4.3.1. Waga słów wyróżnionych w tekście
4.3.2. Słowa kluczowe wskazywane automatycznie
4.4. OCENA ZASTOSOWANYCH METOD USTALANIA WAGI SŁOWA

PODSUMOWANIE
POSTULATY TECHNOLOGICZNE
Standardy metainformacji
Formaty zapisu dokumentów
PROPOZYCJE DALSZYCH BADAŃ

BIBLIOGRAFIA
SPIS TABEL
SPIS ILUSTRACJI
SPIS WYKRESÓW
INDEKS RZECZOWY