Як скласти реферат? Частина 2
Продовження. Початок тут
https://scoolbylife.ru/editor/article/1877/
Витяг даних
Як правило, обсяг файлу-збірки багаторазово перевищує необхідний обсяг реферату, тому виникає необхідність вибрати з файлу-збірки ту частину, яка найбільшою мірою відповідає темі реферату. Зрозуміло, можна виконати цю роботу вручну (цілком розумно, коли файл-збірник не надто великий) - проте часто раціональніше скористатися для цього програмними засобами, наприклад - програмою
Concordance сайт https://concordancesoftware.co.uk
File - Make fast concordance from files - Add files і вказуємо наш файл-збірник.
За великим рахунком, в якості джерела даних можна вказувати не тільки файл-збірник, а й будь-який інший файл, який ми бажаємо препарувати - схема дій залишиться приблизно такою ж.
Подальша робота носить характер творчий, тому певних рекомендацій дати не можна. Обмежимося радою звернути увагу на функції
Pick list
Proximity
Regex
Pick list дозволяє вказати список цікавлять нас слів для вилучення. При цьому можна вказувати як точну словоформу, так і рядок символів - в цьому випадку необхідно на початку і в кінці кожного слова (кореня) поставити * У цьому випадку отримаємо списки фраз (або абзаців), що містять кожну зі знайдених словоформ.
Proximity Якщо нас цікавлять не всі слова (словоформи), але лише ті, які мають відношення до якого-небудь іншому слову (словоформе) використовуємо цю функцію.
Regex Витягує з тексту задану рядок символів. Від попередніх функцій відрізняється чутливістю до регістру. Якщо це призводить до ускладнень, то при створенні файлу-збірки можна додати фільтр Convert - Character cAsE - lowercase У цьому випадку всі букви файлу стануть маленькими, які і можна буде вказувати у віконці функції Regex не боячись пропустити потрібне слово (словоформу) через невідповідності її регістра введеному. Незаперечна перевага функції Regex - витяг з тексту всіх заданих словоформ поспіль - на відміну від Pick list і Proximity, які створюють кілька списків в одному файлі, розбиваючи таким чином цільні тексти.
Важливою відмінністю програм Concordance від інших програм подібного роду - вміння працювати як з абзацами (Actual line), так і з довільної довжини (Selected length) ділянками тексту, зокрема - фразами (sense-unit). Вибрати підходящий варіант можна в меню Text - Context Styles.
Поєднуючи зазначені функції можна домогтися вилучення з тексту практично будь-якого набору даних.
Швидше за все, виявляться зайвими в рефераті номера абзаців файлу-збірки - їх відображення можна регулювати в меню Context - Show Line Numbers і частота народження обраних для вилучення даних Headwords - Show Frequencies.
Після вилучення даних результати можна зберегти в текстовому файлі File - Save as Text. Отриманий файл слід очистити від сміття, зокрема - повторюваних рядків (абзаців). Зробити це можна за допомогою програми TextPipe тим же набором фільтрів, про котром ми писали вище.
Отриманий файл правимо вручну, приводячи до чистового варіанту.
Бажаємо успіхів! :)