Анотація
В роботі розглядаються проблеми визначення автора тексту та виявлення його емоційного контексту на основі методів інтелектуального аналізу. Ви-конано огляд сучасних підходів, які ґрунтуються на статистичному аналізі та методах штучного інтелекту (машинного навчання). Пропонується для вирі-шення поставлених задач використовувати наївний класифікатор Байєса та словниковий метод із застосуванням типового словника AFINN-165. Наведе-но хід та загальні результати проведених комп'ютерних експериментів. Якіс-ні показники експериментальних даних дозволяють стверджувати, що обрані методи аналізу текстів підходять для рішення задач. Встановлено, що для подальших експериментів програмний засіб потребує деяких покращень для збільшення точності ідентифікації.
Посилання
Шумская А.О. Идентифицирующие признаки текстовых сообщений при установлении автора. Ползуновский вестник. 2013. № 2. С. 265–266.
Финн В.К. Об интеллектуальном анализе данных. Новости Искусст-венного интеллекта. 2004. №3. URL: https://www.raai.org/about/persons/finn/pages/finn_kdd.doc (дата звернення: 03.11.2019).
Rhodes D. Author attribution with CNNs. Stanford, California, USA, 2015. P. 1-7.
Michael S. Hart // Gutenberg. URL: https://www.gutenberg.org/wiki/Michael_S._Hart (дата звернення: 02.10.2019).
Keishin N. Authorship identification of translation algorithms, Louisville, Kentucky, USA, 2017. P. 13–19.
TLM | Random Forest. URL: https://www.thelearningmachine.ai/forest (дата звернення: 02.10.2019).
Fasidi F.O, Adebayo O.T. Rule-based Naïve Bayes Classifier for Heart Disease Risk Prediction and Therapy Recommendation. International Journal of Clinical & Medical Informatics. 2019. Vol. 2, № 2. P. 51–59.
Naive Bayes Classifier // Toward Data Science. URL: https://towardsdatascience.com/naive-bayes-classifier-81d512f50a7c (дата звер-нення: 02.10.2019).
Бісікало О.В. Експериментальне дослідження пошуку значущих ключових слів україномовного контенту. Вісник національного університету «Львівська політехніка». 2015. № 829. Львів. С. 255–272.
words/afinn-165: AFINN 165 (list of English words rated for valence) in JSON. URL: https://github.com/words/afinn-165 (дата звертання: 02.10.2019).
wink-nlp-utils – Wink JS – Summary. URL: https://winkjs.org/wink-nlp-utils/index.html (дата звертання: 02.10.2019).
Harry Potter // Kaggle. URL: https://www.kaggle.com/gulsahdemiryurek/harry-potter-dataset (дата звернення: 02.10.2019).
Каргин А.А., Парамонов А.И., Ломонос Я.Г. Интеллектуальная система категоризации и интерпретации текстовой информации «Text-Term-Concept». Моделювання та керування станом еколого-економічних систем регіону. 2006. № 3. С. 122–131.
Shumskaya, A.O. (2013). Identifitsiruyushchie priznaki tekstovykh soobshcheniy pri ustanovlenii avtora [Identifying features of text messages in es-tablishing the author]. Polzunovsky vestnik, no. 2, pp. 265–266.
Finn, V.K. (2004). Ob intellektual'nom analize dannykh [About intellec-tual data analysis]. Novosti Iskusstvennogo intellekta [Artificial intelligence news] (electronic journal), no. 3. Available at: https://www.raai.org/about/persons/finn/pages/finn_kdd.doc (accessed 03 October 2019).
Rhodes, D. (2015). Author attribution with CNNs. Department of Computer Science Stanford University, pp. 1-7.
Michael, S. Hart – Gutenberg. Available at: https://www.gutenberg.org/wiki/Michael_S._Hart (accessed: 02 October 2019).
Keishin, N. (2017). Authorship identification of translation algorithms. Electronic Theses and Dissertations, pp. 13–19.
TLM | Random Forest. Available at: https://www.thelearningmachine.ai/forest (accessed: 02 October 2019).
Fasidi, F.O., & Adebayo, O.T. (2019). Rule-based Naïve Bayes Classifier for Heart Disease Risk Prediction and Therapy Recommendation. International Journal of Clinical & Medical Informatics, vol. 2, № 2, pp. 51–59.
Naive Bayes Classifier – Toward Data Science. Available at: https://towardsdatascience.com/naive-bayes-classifier-81d512f50a7c (accessed: 02 October 2019).
Bisikalo, O.V. (2015). Eksperymentalne doslidzhennia poshuku znachushchykh kliuchovykh sliv ukrainomovnoho kontentu [An experimental study of the search for meaningful keywords in Ukrainian-language content]. Visnyk natsionalnoho universytetu «Lvivska politekhnika», no. 829, pp. 255–272.
words/afinn-165: AFINN 165 (list of English words rated for valence) in JSON. Available at: https://github.com/words/afinn-165 (accessed: 02 October 2019).
wink-nlp-utils – Wink JS – Summary. Available at: https://winkjs.org/wink-nlp-utils/index.html (accessed: 02 October 2019).
Harry Potter - Kaggle. Available at: https://www.kaggle.com/gulsahdemiryurek/harry-potter-dataset (accessed: 02 Oc-tober 2019).
Kargin, A.A., Paramonov, A.I., & Lomonos, Ya.G. (2006). Intellektual'naya sistema kategorizatsii i interpretatsii tekstovoy informatsii «Text-Term-Concept». Modeliuvannia ta keruvannia stanom ekoloho-ekonomichnykh system rehionu, no. 3, pp. 122–131.