موتور جستجوی نظرات در فصل 3 معرفی شد. چکیده‌ای از نتایج به‌دست‌آمده از آزمایش‌های انجام‌شده را می‌توان به این ترتیب ذکر کرد :
به‌نظر می‌رسد مجموعاً رده‌بند SVM عملکرد بهتری را در کسب بالاترین دقت‌ها از خود نشان‌ داده است. اما در‌عین‌حال با توجه به اهمیت ویژه‌ای که ممکن است برخی مشخصه‌ها داشته باشند، مثل ترکیب دو مشخصه‌ی “نشانه‌های سؤال” و “گرایش آغاز‌گر” در این پروژه و برتری قابل‌توجه رده‌بند NaïveBayesian در استفاده از آن‌ها، به‌نظر می‌رسد که این رده‌بند نیز باید حتی‌الامکان مورد بررسی قرار گیرد.
آزمایش‌های انجام‌شده با استفاده از رده‌بند‌های دیگر، نشان از مطلوبیت دو رده‌بند اصلی استفاده‌شده دارد و لزوم توجه به آن‌ها را نشان می‌دهد.
دو مشخصه‌ی جدید معرفی شده (“نشانه‌های سؤال” و “گرایش آغاز‌گر”) توانایی خود را هم در ترکیب با مشخصه‌های قبل (“صفات و قیود مثبت و منفی”) و بهبود نتایج به‌دست‌آمده با آن‌ها، و هم به صورت مستقل از مشخصه‌های دیگر و در ترکیب با هم نشان دادند.
اهمیت استفاده از صفات در متون زبان فارسی نشان داده شد. توجه به این اهمیت در کنار پرزحمت و زمان‌بر بودن استخراج دقیق آن‌ها و ضعف سیستم‌های فعلی، لزوم افزایش دقت سیستم‌های تشخیص خود‌کار را مشخص می‌کند.
در مورد قیود استخراج‌شده به‌صورت انسانی اگرچه استفاده از این مشخصه به صورت تکی گاهی خوب و گاهی بسیار بد بوده است اما بهترین نتیجه زمانی به‌دست آمده است که از آن استفاده شده است.
انجام برخی از عملیات پیش‌پردازش نظیر اصلاح فاصله‌گذاری‌ها، تبدیل حالات محاوره‌ای به معیار، و اصلاح غلط‌های املائی به‌صورت انسانی در این کار، درکنار در دسترس نبودن مطلوب سیستم‌هایی که این اعمال را به‌صورت خودکار انجام دهند و از عهده‌ی رفع ابهامات موجود در لغات زبان فارسی هم بر آیند، اهمیت کار در راستای تهیه‌ی این سیستم‌ها را نشان می‌دهد.
لحاظ کردن برخی از لغاتی که گرایش آن‌ها با استفاده از بررسی زمینه مشخص می‌شد، و انجام مجدد برخی از آزمایش‌ها نتوانست به بهبود نتایج کمک کند، هرچند این موضوع نیاز به بررسی بیشتری دارد.

5-2. کار‌های آتی
در روند مطالعات انجام شده غیر از مشخصه‌های به‌کار‌گرفته‌شده، مشخصه‌های جالب توجه دیگری نیز به‌نظر رسید که بررسی آن‌ها می‌تواند مفید باشد ازجمله‌ی این مشخصه‌ها می‌توان به “لغات تاثیر‌گذار غیر از صفت و قید”، “آغازگر جملات داخلی نظرات”، و ضرب‌المثل‌ها اشاره کرد.
تعیین گرایش مثبت یا منفی لغات، اگر به‌صورت خودکار انجام شود می‌تواند حجم قابل توجهی از کار انسانی لازم را کاهش داده و انجام مطالعات آتی را تسهیل کند.
کار در مورد ابعاد دیگر بحث‌های مهم در رابطه با تحلیل احساس، علی‌الخصوص شناسایی هدف مورد اظهار‌نظر توسط کاربر از جمله مطالعاتی است که نیاز و اهمیت آن احساس می‌شود.
پیاده‌سازی اولیه‌ی معماری ارائه‌شده در فصل 3 نیز از کارهایی است که پرداختن به آن دارای جذابیت و اهمیت قابل‌توجهی است .

مراجع و ماخذ

[1]

Pang B and Lee L. January 2008. Opinion Mining and Sentiment Analysis. Found. Trends Inf. Retr. 2, 1-2, 1-135.
[2]

Liu B. 2011. Web Data Mining, Exploring HyperLinks, contents, and Usage Data. Springer.
[3]

Wiegand M and Klakow D. 2010. Convolution kernels for opinion holder extraction. In Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics (HLT). Association for Computational Linguistics, Stroudsburg, PA, USA, 795-803.
[4]

Lu B. 2010. Identifying opinion holders and targets with dependency parser in Chinese news texts. In Proceedings of the NAACL HLT Student Research Workshop (HLT-SRWS). Association for Computational Linguistics, Stroudsburg, PA, USA, 46-51.
[5]

Awadallah R, Ramanath M, and Weikum G. 2011. OpinioNetIt: understanding the opinions-people network for politically controversial topics. In Proceedings of the 20th ACM international conference on Information and knowledge management (CIKM), Bettina Berendt, Arjen de Vries, Wenfei Fan, Craig Macdonald, Iadh Ounis, and Ian Ruthven (Eds.). ACM, New York, NY, USA, 2481-2484.
[6]

مطلب مشابه :  تحقیق دربارهعملکرد گندم

Goujon B. 2011. Text Mining for Opinion Target Detection. In Proceedings of the European Intelligence and Security Informatics Conference (EISIC). IEEE Computer Society, Washington, DC, USA, 322-326.
[7]

Mukund S, Ghosh D, and Srihari R. 2011. Using sequence kernels to identify opinion entities in Urdu. In Proceedings of the Fifteenth Conference on Computational Natural Language Learning (CoNLL ’11). Association for Computational Linguistics, Stroudsburg, PA, USA, 58-67.
[8]

Jiang L, Yu M, Zhou M, Liu X, and Zhao T. 2011. Target-dependent Twitter sentiment classification. In Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies – Volume 1 (HLT), Vol. 1. Association for Computational Linguistics, Stroudsburg, PA, USA, 151-160.
[9]

Wang H, Lu Y, and Zhai C. 2011. Latent aspect rating analysis without aspect keyword supervision. In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD). ACM, New York, NY, USA, 618-626.
[10]

Yohan J and Alice H. 2011. Aspect and sentiment unification model for online review analysis. In Proceedings of the fourth ACM international conference on Web search and data mining (WSDM). ACM, New York, NY, USA, 815-824.
[11]

Baccianella S, Esuli A, and Sebastiani F. 2009. Multi-facet Rating of Product Reviews. In Proceedings of the 31th European Conference on IR Research on Advances in Information Retrieval (ECIR), Mohand Boughanem, Catherine Berrut, Josiane Mothe, and Chantal Soule-Dupuy (Eds.). Springer-Verlag, Berlin, Heidelberg, 461-472.
[12]

Shimada K and Endo T. 2008. Seeing several stars: a rating inference task for a document containing several evaluation criteria. In Proceedings of the 12th Pacific-Asia conference on Advances in knowledge discovery and data mining (PAKDD). Springer-Verlag, Berlin, Heidelberg, 1006-1014.
[13]

Liu J and Seneff S. 2009. Review sentiment scoring via a parse-and-paraphrase paradigm. In Proceedings of the Conference on Empirical Methods in Natural Language
Processing: Volume 1 – Volume 1 (EMNLP), Vol. 1. Association for Computational Linguistics, Stroudsburg, PA, USA, 161-169.
[14]

Baykan E, Henzinger M, Marian L, and Weber I. 2011. A Comprehensive Study of Features and Algorithms for URL-Based Topic Classification. ACM Trans. Web 5, 3, Article 15, 29 pages. July
[15]

Baykan E, Henzinger M, and Weber I. August 2008. Web page language identification based on URLs. Proc. VLDB Endow. 1, 1, 176-187.
[16]

Zubaryeva O and Savoy J. 2009. Investigation in statistical language-independent approaches for opinion detection in English, Chinese and Japanese. In Proceedings of the Third International Workshop on Cross Lingual Information Access: Addressing the Information Need of Multilingual Societies (CLIAWS3). Association for Computational Linguistics, Stroudsburg, PA, USA, 38-45.
[17]

Osman D, Yearwood J, and Vamplew P. 2007. Using corpus analysis to inform research into opinion detection in blogs. In Proceedings of the sixth Australasian conference on Data mining and analytics – Volume 70 (AusDM), Vol. 70. Australian Computer Society, Inc., Darlinghurst, Australia, 65-75.
[18]

Yu N and Kübler S. 2011. Filling the gap: semi-supervised learning for opinion detection across domains. In Proceedings of the Fifteenth Conference on Computational Natural Language Learning (CoNLL). Association for Computational Linguistics, Stroudsburg, PA, USA, 200-209.
[19]

Gongshen L, Huoyao L, Jun L, Jiuchuan L. 2010. Predicting the Semantic Orientation of Movie
Reviews. Seventh International Conference on Fuzzy Systems and Knowledge Discovery (FSKD).
[20]

Pang B, Lee L, Vaithyanathan S. 2002. Thumbs up? Sentiment classification using machine learning techniques. In Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing (EMNLP).
[21]

Meena A and Prabhakar T. 2007. Sentence level sentiment analysis in the presence of conjuncts using linguistic analysis. In Proceedings of the 29th European conference on IR research (ECIR). Springer-Verlag, Berlin, Heidelberg, 573-580.
[22]

Fu G and Wang X. 2010. Chinese sentence-level sentiment classification based on fuzzy sets. In Proceedings of the 23rd International Conference on Computational Linguistics: Posters (COLING). Association for Computational Linguistics, Stroudsburg, PA, USA, 312-319.
[23]

مطلب مشابه :  تحقیق دربارهگیاه، ریشه، نیتروژن، افزایش

Engonopoulos N, Lazaridou A, Paliouras G, and Chandrinos K. 2011. ELS: a word-level method for entity-level sentiment analysis. In Proceedings of the International Conference on Web Intelligence, Mining and Semantics (WIMS). ACM, New York, NY, USA, Article 12, 9 pages.
[24]

Thet T, Cheon J, and Khoo C. December 2010. Aspect-based sentiment analysis of movie reviews on discussion boards. J. Inf. Sci. 36, 6, 823-848.
[25]

Esuli A and Sebastiani F. 2006. “SentiWordNet: A publicly available lexical resource for opinion mining”, in Proceedings of Language Resources and Evaluation (LREC).
[26]

Baccianella A and Sebastiani F. 2010. SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining, in ‘Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC), European Language Resources Association (ELRA), Valletta, Malta.
[27]

MEJOVA, Y., SRINIVASAN, P. 2011. Exploring Feature Definition and Selection for Sentiment Classifiers. International AAAI Conference on Weblogs and Social Media, North America, jul.
[28]

Hu X and Wu B. 2009. Classification and Summarization of Pros and Cons for Customer Reviews. In Proceedings of IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology – Volume 03 (WI-IAT), Vol. 3. IEEE Computer Society, Washington, DC, USA, 73-76.
[29]

Lerman K, Goldensohn S, and McDonald R. 2009. Sentiment summarization: evaluating and learning user preferences. In Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL). Association for Computational Linguistics, Stroudsburg, PA, USA, 514-522.
[30]

Zhang Z and Varadarajan B. 2006. Utility scoring of product reviews. In Proceedings of the 15th ACM international conference on Information and knowledge management (CIKM). ACM, New York, NY, USA, 51-57.
[31]

Huang S, Shen D, Feng W, Zhang Y, and Baudin C. 2009. Discovering clues for review quality from author’s behaviors on e-commerce sites. In Proceedings of the 11th International Conference on Electronic Commerce (ICEC). ACM, New York, NY, USA, 133-141.
[32]

Lu Y, Tsaparas P, Ntoulas A, and Polanyi L. 2010. Exploiting social context for review quality prediction. In Proceedings of the 19th international conference on World wide web (WWW). ACM, New York, NY, USA, 691-700.
[33]

Lau R, Liao S, Kwok R, Xu K, Xia Y, and Li Y. January 2012. Text mining and probabilistic language modeling for online review spam detection. ACM Trans. Manage. Inf. Syst. 2, 4, Article 25, 30 pages.
[34]

Jindal N and Liu B. 2008. Opinion spam and analysis. In Proceedings of the international conference on Web search and web data mining (WSDM). ACM, New York, NY, USA, 219-230.
[35]

Lim E, Nguyen V, Jindal N, Liu B, and Lauw H. 2010. Detecting product review spammers using rating behaviors. In Proceedings of the 19th ACM international conference on Information and knowledge management (CIKM). ACM, New York, NY, USA, 939-948.
[36]

Jindal N, Liu B, and Lim E. 2010. Finding unusual review patterns using unexpected rules. In Proceedings of the 19th ACM international conference on Information and knowledge management (CIKM). ACM, New York, NY, USA, 1549-1552.
[37]

Shamsfard M, Jafari H, Ilbeygi M. 2010. STeP-1: A Set of Fundamental Tools for Persian Text Processing, LREC 2010-8th Language Resources and Evaluation Conference, Malta.
[38]

Manning C, Raghavan P, Schütze H. 2008. Introduction to Information Retrieval. Cambridge UP.

پیوست الف

50 اظهار‌نظر استفاده شده (از 30 خبر)، به‌همراه مشخصه‌های استخراج‌شده از داخل آن‌ها


دیدگاهتان را بنویسید