ПРОГРАМНИЙ ЗАСІБ ІДЕНТИФІКАЦІЇ АВТОРА ТЕКСТУ ТА ВИЯВ-ЛЕННЯ ЕМОЦІЙНОГО КОНТЕКСТУ
PDF

Ключові слова

аналіз тексту
ідентифікація
емоційний контекст
наївний класифікатор Байєса
сентимент аналіз

Як цитувати

Зеленько, Ю., & Парамонов, А. (2019). ПРОГРАМНИЙ ЗАСІБ ІДЕНТИФІКАЦІЇ АВТОРА ТЕКСТУ ТА ВИЯВ-ЛЕННЯ ЕМОЦІЙНОГО КОНТЕКСТУ. Молодий вчений, 11 (75), 685-689. https://doi.org/10.32839/2304-5809/2019-11-75-145

Анотація

В роботі розглядаються проблеми визначення автора тексту та виявлення його емоційного контексту на основі методів інтелектуального аналізу. Ви-конано огляд сучасних підходів, які ґрунтуються на статистичному аналізі та методах штучного інтелекту (машинного навчання). Пропонується для вирі-шення поставлених задач використовувати наївний класифікатор Байєса та словниковий метод із застосуванням типового словника AFINN-165. Наведе-но хід та загальні результати проведених комп'ютерних експериментів. Якіс-ні показники експериментальних даних дозволяють стверджувати, що обрані методи аналізу текстів підходять для рішення задач. Встановлено, що для подальших експериментів програмний засіб потребує деяких покращень для збільшення точності ідентифікації.

https://doi.org/10.32839/2304-5809/2019-11-75-145
PDF

Посилання

Шумская А.О. Идентифицирующие признаки текстовых сообщений при установлении автора. Ползуновский вестник. 2013. № 2. С. 265–266.

Финн В.К. Об интеллектуальном анализе данных. Новости Искусст-венного интеллекта. 2004. №3. URL: https://www.raai.org/about/persons/finn/pages/finn_kdd.doc (дата звернення: 03.11.2019).

Rhodes D. Author attribution with CNNs. Stanford, California, USA, 2015. P. 1-7.

Michael S. Hart // Gutenberg. URL: https://www.gutenberg.org/wiki/Michael_S._Hart (дата звернення: 02.10.2019).

Keishin N. Authorship identification of translation algorithms, Louisville, Kentucky, USA, 2017. P. 13–19.

TLM | Random Forest. URL: https://www.thelearningmachine.ai/forest (дата звернення: 02.10.2019).

Fasidi F.O, Adebayo O.T. Rule-based Naïve Bayes Classifier for Heart Disease Risk Prediction and Therapy Recommendation. International Journal of Clinical & Medical Informatics. 2019. Vol. 2, № 2. P. 51–59.

Naive Bayes Classifier // Toward Data Science. URL: https://towardsdatascience.com/naive-bayes-classifier-81d512f50a7c (дата звер-нення: 02.10.2019).

Бісікало О.В. Експериментальне дослідження пошуку значущих ключових слів україномовного контенту. Вісник національного університету «Львівська політехніка». 2015. № 829. Львів. С. 255–272.

words/afinn-165: AFINN 165 (list of English words rated for valence) in JSON. URL: https://github.com/words/afinn-165 (дата звертання: 02.10.2019).

wink-nlp-utils – Wink JS – Summary. URL: https://winkjs.org/wink-nlp-utils/index.html (дата звертання: 02.10.2019).

Harry Potter // Kaggle. URL: https://www.kaggle.com/gulsahdemiryurek/harry-potter-dataset (дата звернення: 02.10.2019).

Каргин А.А., Парамонов А.И., Ломонос Я.Г. Интеллектуальная система категоризации и интерпретации текстовой информации «Text-Term-Concept». Моделювання та керування станом еколого-економічних систем регіону. 2006. № 3. С. 122–131.

Shumskaya, A.O. (2013). Identifitsiruyushchie priznaki tekstovykh soobshcheniy pri ustanovlenii avtora [Identifying features of text messages in es-tablishing the author]. Polzunovsky vestnik, no. 2, pp. 265–266.

Finn, V.K. (2004). Ob intellektual'nom analize dannykh [About intellec-tual data analysis]. Novosti Iskusstvennogo intellekta [Artificial intelligence news] (electronic journal), no. 3. Available at: https://www.raai.org/about/persons/finn/pages/finn_kdd.doc (accessed 03 October 2019).

Rhodes, D. (2015). Author attribution with CNNs. Department of Computer Science Stanford University, pp. 1-7.

Michael, S. Hart – Gutenberg. Available at: https://www.gutenberg.org/wiki/Michael_S._Hart (accessed: 02 October 2019).

Keishin, N. (2017). Authorship identification of translation algorithms. Electronic Theses and Dissertations, pp. 13–19.

TLM | Random Forest. Available at: https://www.thelearningmachine.ai/forest (accessed: 02 October 2019).

Fasidi, F.O., & Adebayo, O.T. (2019). Rule-based Naïve Bayes Classifier for Heart Disease Risk Prediction and Therapy Recommendation. International Journal of Clinical & Medical Informatics, vol. 2, № 2, pp. 51–59.

Naive Bayes Classifier – Toward Data Science. Available at: https://towardsdatascience.com/naive-bayes-classifier-81d512f50a7c (accessed: 02 October 2019).

Bisikalo, O.V. (2015). Eksperymentalne doslidzhennia poshuku znachushchykh kliuchovykh sliv ukrainomovnoho kontentu [An experimental study of the search for meaningful keywords in Ukrainian-language content]. Visnyk natsionalnoho universytetu «Lvivska politekhnika», no. 829, pp. 255–272.

words/afinn-165: AFINN 165 (list of English words rated for valence) in JSON. Available at: https://github.com/words/afinn-165 (accessed: 02 October 2019).

wink-nlp-utils – Wink JS – Summary. Available at: https://winkjs.org/wink-nlp-utils/index.html (accessed: 02 October 2019).

Harry Potter - Kaggle. Available at: https://www.kaggle.com/gulsahdemiryurek/harry-potter-dataset (accessed: 02 Oc-tober 2019).

Kargin, A.A., Paramonov, A.I., & Lomonos, Ya.G. (2006). Intellektual'naya sistema kategorizatsii i interpretatsii tekstovoy informatsii «Text-Term-Concept». Modeliuvannia ta keruvannia stanom ekoloho-ekonomichnykh system rehionu, no. 3, pp. 122–131.