2.793

                    2018影響因子

                    (CJCR)

                    • 中文核心
                    • EI
                    • 中國科技核心
                    • Scopus
                    • CSCD
                    • 英國科學文摘

                    留言板

                    尊敬的讀者、作者、審稿人, 關于本刊的投稿、審稿、編輯和出版的任何問題, 您可以本頁添加留言。我們將盡快給您答復。謝謝您的支持!

                    姓名
                    郵箱
                    手機號碼
                    標題
                    留言內容
                    驗證碼

                    基于短文本情感增強的在線學習者成績預測方法

                    葉俊民 羅達雄 陳曙

                    葉俊民, 羅達雄, 陳曙. 基于短文本情感增強的在線學習者成績預測方法. 自動化學報, 2020, 46(9): 1927?1940. doi: 10.16383/j.aas.c190008
                    引用本文: 葉俊民, 羅達雄, 陳曙. 基于短文本情感增強的在線學習者成績預測方法. 自動化學報, 2020, 46(9): 1927?1940. doi: 10.16383/j.aas.c190008
                    Ye Jun-Min, Luo Da-Xiong, Chen Shu. Short-text sentiment enhanced achievement prediction method for online learners. Acta Automatica Sinica, 2020, 46(9): 1927?1940. doi: 10.16383/j.aas.c190008
                    Citation: Ye Jun-Min, Luo Da-Xiong, Chen Shu. Short-text sentiment enhanced achievement prediction method for online learners. Acta Automatica Sinica, 2020, 46(9): 1927?1940. doi: 10.16383/j.aas.c190008

                    基于短文本情感增強的在線學習者成績預測方法


                    DOI: 10.16383/j.aas.c190008
                    詳細信息
                      作者簡介:

                      華中師范大學計算機學院教授. 主要研究方向為學習分析和教育數據挖掘.E-mail: jmye@mail.ccnu.edu.cn

                      華中師范大學計算機學院碩士研究生. 主要研究方向為自然語言處理和教育數據挖掘. 本文通信作者.E-mail: 18140663659@163.com

                      華中師范大學計算機學院講師. 主要研究方向為軟件工程和學習分析.E-mail: chenshu@mail.ccnu.edu.cn

                    • 基金項目:  國家社會科學基金一般項目 (17BTQ061)資助

                    Short-text Sentiment Enhanced Achievement Prediction Method for Online Learners

                    More Information
                    • Fund Project:  Supported by National Social Science Fund General Project of China (17BTQ061)
                    • 摘要: 當前利用短文本情感信息進行在線學習成績預測的研究存在以下問題: 1)當前情感分類模型無法有效適應在線學習社區的短文本特征, 分類效果較差; 2)利用短文本情感信息定量預測在線學習成績的研究在準確性上還有較大的提升空間. 針對以上問題, 本文提出了一種短文本情感增強的成績預測方法. 首先, 從單詞和句子層面建模短文本語義, 并提出基于學習者特征的注意力機制以識別不同學習者的語言表達特點, 得到情感概率分布向量; 其次, 將情感信息與統計、學習行為信息相融合, 并基于長短時記憶網絡建模學習者的學習狀態; 最后, 基于學習狀態預測學習者成績. 在三種不同類別課程組成的真實數據集上進行了實驗, 結果表明本文方法能有效對學習社區短文本進行情感分類, 且能夠提升在線學習者成績預測的準確性. 同時, 結合實例分析說明了情感信息、學習狀態與成績之間的關聯.
                    • 圖  1  基于短文本情感增強的在線學習行為預測方法框架

                      Fig.  1  Short-text sentiment enhanced achievement prediction method for online learners framework

                      圖  2  在線學習社區短文本表示模型

                      Fig.  2  Sentiment classification model for online learning community short text

                      圖  3  學習狀態建模與成績預測過程

                      Fig.  3  Learning state modeling and achievement prediction process framework

                      圖  4  不同特征對任務的貢獻

                      Fig.  4  Contribution of different features for tasks

                      圖  5  不同的m對任務的影響

                      Fig.  5  Contribution of different m for tasks

                      圖  6  學習狀態與成績的關系

                      Fig.  6  Relationship between learning status and achievement

                      圖  7  學習狀態呈現正向變化的學習者占區間總學習者的比率(積極情感)

                      Fig.  7  The ratio of learners who have a positive change in learning status to the total learner in the interval (positive emotions)

                      表  1  不同類別課程的數量

                      Table  1  Number of different types of courses

                      課程類別 課程 合計課程數量數量 (門)
                      工科 計算機科學, 電子工程 5
                      理科 物理 2
                      文科及其他 歷史,體育 4
                      下載: 導出CSV

                      表  4  模型部分使用的特征

                      Table  4  Part features used in the model

                      特征類別 特征個數 部分特征
                      統計特征 8+ 性別、年齡、教育層次、相關先行課成績等
                      學習行為特征 16+ 發帖次數、被回帖次數、觀看教學視頻時間、知識點測驗成績等
                      下載: 導出CSV

                      表  2  不同類別課程的人數及發帖數量

                      Table  2  Number of people and post in different type courses

                      課程類別 平均學習者人數 (人) 每個知識點下的發/回帖數量 (個)
                      工科 2 326 3 200
                      理科 2 681 1 520
                      文科及其他 2 170 1 060
                      下載: 導出CSV

                      表  3  不同類別課程的情感類別分布

                      Table  3  Distribution of sentiment categories in different type courses

                      課程類別 情感類別分布 (約簡為整數), 積極/消極/疑惑/正常情緒 (%)
                      工科 16/14/37/33
                      理科 21/19/27/33
                      文科及其他 29/12/22/37
                      下載: 導出CSV

                      表  5  工程類課程的情感分類結果

                      Table  5  Sentiment classification results of engineering courses

                      方法 ACC RMSE
                      Trigram 0.373 1.754
                      TextFeature 0.415 1.789
                      SSWE 0.353 1.976
                      RNN + RNN 0.432 1.673
                      Paragraph Vector 0.379 1.834
                      DMGRNN 0.506 1.394
                      HAN 0.532 1.281
                      本文方法 0.573 1.185
                      下載: 導出CSV

                      表  7  文科及其他類課程的情感分類結果

                      Table  7  Sentiment classification results of no-science courses

                      方法 ACC RMSE
                      Trigram 0.549 0.814
                      TextFeature 0.562 0.811
                      SSWE 0.568 0.864
                      RNN + RNN 0.585 0.806
                      Paragraph Vector 0.578 0.772
                      DMGRNN 0.650 0.685
                      HAN 0.677 0.633
                      本文方法 0.706 0.584
                      下載: 導出CSV

                      表  6  理科類課程的情感分類結果

                      Table  6  Sentiment classification results of science courses

                      方法 ACC RMSE
                      Trigram 0.543 0.822
                      TextFeature 0.556 0.850
                      SSWE 0.550 0.851
                      RNN + RNN 0.580 0.786
                      Paragraph Vector 0.556 0.821
                      DMGRNN 0.644 0.696
                      HAN 0.674 0.652
                      本文方法 0.693 0.628
                      下載: 導出CSV

                      表  8  工科類課程的成績預測結果

                      Table  8  Achievements prediction results of engineering courses

                      方法 Accuracy RMSE
                      MR? 0.566 0.479
                      MR+ 0.590 0.452
                      MLP? 0.583 0.464
                      MLP+ 0.603 0.437
                      XGBoost? 0.679 0.335
                      XGBoost+ 0.697 0.284
                      FM 0.674 0.326
                      LadFG 0.818 0.226
                      SEAP 0.874 0.095
                      下載: 導出CSV

                      表  10  文科及其他類課程的成績預測結果

                      Table  10  Achievements prediction results of no-science courses

                      方法 Accuracy RMSE
                      MR? 0.648 0.409
                      MR+ 0.664 0.336
                      MLP? 0.652 0.340
                      MLP+ 0.688 0.307
                      XGBoost? 0.701 0.281
                      XGBoost+ 0.743 0.269
                      FM 0.726 0.222
                      LadFG 0.874 0.154
                      SEAP 0.924 0.051
                      下載: 導出CSV

                      表  9  理科類課程的成績預測結果

                      Table  9  Achievements prediction results of science courses

                      方法 Accuracy RMSE
                      MR? 0.598 0.430
                      MR+ 0.612 0.419
                      MLP? 0.618 0.408
                      MLP+ 0.643 0.372
                      XGBoost? 0.689 0.295
                      XGBoost+ 0.709 0.278
                      FM 0.687 0.295
                      LadFG 0.803 0.203
                      SEAP 0.902 0.084
                      下載: 導出CSV
                      360彩票
                    • [1] Seaton D T, Bergner Y, Chuang I, Mitros P, Pritchard D E. Who does what in a massive open online course? Communications of the ACM, 2014, 44(4): 58−65
                      [2] Kizilcec R F, Piech C, Schneider E. Deconstructing disengagement: Analyzing learner subpopulations in massive open online courses. In: Proceedings of the 3rd International Conference on Learning Analytics and Knowledge. Leuven, Belgium: ACM, 2013. 170?179
                      [3] Fujita H. Neural-fuzzy with representative sets for prediction of student performance. Applied Intelligence, 2019, 49(1): 172?187 doi:  10.1007/s10489-018-1262-7
                      [4] Guay F, Bureau J S. Motivation at school: Difierentiation between and within school subjects matters in the prediction of academic achievement. Contemporary Educational Psychology, 2018, 54(1): 42?54
                      [5] Bergold S, Steinmayr R. Personality and intelligence interact in the prediction of academic achievement. Journal of Intelligence, 2018, 6(2): 27?27 doi:  10.3390/jintelligence6020027
                      [6] Gardner J, Brooks C. Student success prediction in MOOCs. User Modeling and User-Adapted Interaction, 2018, 28(2): 127?203 doi:  10.1007/s11257-018-9203-z
                      [7] Fujita H. Neural-fuzzy with representative sets for prediction of student performance. Applied Intelligence, 2019, 49(1): 172?187 doi:  10.1007/s10489-018-1262-7
                      [8] Dalipi F, Imran A S, Kastrati Z. MOOC dropout prediction using machine learning techniques: Review and research challenges. In: Proceedings of the 2018 Global Engineering Education Conference. Albuquerque, USA: IEEE, 2018. 1007−1014
                      [9] Conijn R, Van den Beemt A, Cuijpers P. Predicting student performance in a blended MOOC. Journal of Computer Assisted Learning, 2018, 34(5): 612?628
                      [10] Corbett A T, Anderson J R. Knowledge tracing: Modeling the acquisition of procedural knowledge. User Modeling and User-Adapted Interaction, 1994, 4(4): 235?278
                      [11] Piech C, Bassen J, Huang J, Ganguli S, Sahami M, Guibas L, Sohl-Dickstein J. Deep knowledge tracing. Computer Science, 2015, 3(3): 19?23
                      [12] Zhang J N, Shi X J, King I, Yeung D Y. Dynamic key-value memory network for knowledge tracing. In: Proceedings of the 26th International Conference on World Wide Web Conferences, Perth, Western Australia: ACM, 2017. 765−774
                      [13] Embretson S E, Reise S P. Item response theory for psychologists. Quality of Life Research, 2004, 13(3): 715?716 doi:  10.1023/B:QURE.0000021503.45367.f2
                      [14] Torre J D L. DINA model and parameter estimation: A didactic. Journal of Educational and Behavioral Statistics, 2009, 34(1): 115?130
                      [15] Liu Q, Wu R Z, Chen E H, Xu G D, Su Y, Chen Z G, Hu G P. Fuzzy cognitive diagnosis for modelling examinee performance. ACM Transactions on Intelligent Systems and Technology, 2018, 9(4): 1?26
                      [16] Anderson A, Huttenlocher D, Kleinberg J, Leskovec J. Engaging with massive online courses. In: Proceedings of the 23rd International Conference on World Wide Web. New York, USA: ACM, 2014. 687−698
                      [17] Ramesh A, Goldwasser D, Huang B, Daumé H, Getoor L. Learning latent engagement patterns of students in online courses. In: Proceedings of the 28th AAAI Conference on Artiflcial Intelligence. Québec, Canada: AAAI, 2014.1272?1278
                      [18] Bayer J, Byd?ovská H, Géryk J, Ob?íva? T, Popelínsky L. Predicting drop-out from social behaviour students. In: Proceedings of the 4th International Conference on Educational Data Mining. Eindhoven, Netherlands: IEDM 2012. 103−109
                      [19] Sweeney M, Rangwala H, Lester J, Johri A. Next-term student performance prediction: A recommender systems approach. In: Proceedings of the 8th International Conference on Educational Data Mining. Madrid, Spain: IEDM. 2016. 7?7
                      [20] Ren Z, Xia N, Rangwala H. Grade prediction with temporal course-wise influence. arXiv:1709.05433, 2017.
                      [21] Qiu J Z, Tang J, Liu T X, Gong J, Zhang C H, Zhang Q, Xue Y F. Modeling and predicting learning behavior in MOOCs. In: Proceedings of the 2016 ACM International Conference on Web Search and Data Mining. San Francisco, USA: ACM, 2016. 93?102
                      [22] Yang H, Cheung L P. Implicit heterogeneous features embedding in deep knowledge tracing. Cognitive Computation, 2018, 10(1): 3?14 doi:  10.1007/s12559-017-9522-0
                      [23] Zhang L, Xiong X L, Zhao S Y, Botelho A F, Heffernan N T. Incorporating rich features into deep knowledge tracing. In: Proceedings of the 4th ACM Conference on Learning Scale. Cambridge, USA: ACM, 2017. 169?172
                      [24] Huang Y. Deeper knowledge tracing by modeling skill application context for better personalized learning. In: Proceedings of the 2016 Conference on User Modeling Adaptation and Personalization. Halifax, Canada: ACM, 2016. 325−328
                      [25] Su Y, Liu Q W, Liu Q, Huang Z Y, Yin Y, Chen E H, Ding C, Wei S, Hu G P. Exercise-enhanced sequential modeling for student performance prediction. In: Proceedings of the 32nd AAAI Conference on Artiflcial Intelligence. New Orleans, USA: AAAI, 2018. 2435?2443
                      [26] Feng W Z, Tang J, Liu T X. Understanding dropouts in MOOCs. In: Proceedings of the 32nd AAAI Conference on Artiflcial Intelligence, Hawaii, USA: AAAI, 2019.
                      [27] Wen M M, Yang D Y, Rosé C P. Sentiment analysis in MOOC discussion forums: What does it tell us? In: Proceedings of the 6th International Conference on Educational Data Mining. London, UK: IEDM, 2014. 130−138
                      [28] Tucker C, Pursel B K, Divinsky A. Mining studentgenerated textual data in MOOCs and quantifying their effects on student performance and learning outcomes. The ASEE Computers in Education Journal, 2014, 5(4): 84?84
                      [29] Chaplot D S, Rhim E, Kim J. Predicting student attrition in MOOCs using sentiment analysis and neural networks. In: Proceedings of the 2015 Workshops at the 17th International Conference on Artiflcial Intelligence in Education. Madrid, Spain: CEUR-WS.org, 2015. 7−12
                      [30] 馮沖, 康麗琪, 石戈, 黃河燕. 融合對抗學習的因果關系抽取. 自動化學報, 2018, 44(5): 811?818

                      Feng Chong, Kang Li-Qi, Shi Ge, Huang He-Yan. Causality extraction with GAN. Acta Automatica Sinica, 2018, 44(5): 811?818
                      [31] 郝洺, 徐博, 殷緒成, 王方圓. 基于n-gram頻率的語種識別改進方法. 自動化學報, 2018, 44(3): 453?460

                      Hao Ming, Xu Bo, Yin Xu-Cheng, Wang Fang-Yuan. Improve language identiflflcation method by means of n-gram frequency. Acta Automatica Sinica, 2018, 44(3): 453?460
                      [32] 侯麗微, 胡珀, 曹雯琳. 主題關鍵詞信息融合的中文生成式自動摘要研究. 自動化學報, 2019, 45(3): 530?539

                      Hou Li-Wei, Hu Po, Cao Wen-Lin. Automatic Chinese abstractive summarization with topical keywords fusion. Acta Automatica Sinica, 2019, 45(3): 530?539
                      [33] Wu Z, Dai X Y, Yin C Y, Huang S J, Chen J J. Improving review representations with user attention and product attention for sentiment classiflcation. In: Proceedings of the 32nd AAAI Conference on Artiflcial Intelligence. New Orleans, USA: AAAI, 2018. 5989?5996
                      [34] Pennington J, Socher R, Manning C. Glove: Global vectors for word representation. In: Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Doha, Qatar: ACL, 2014: 1532−1543
                      [35] Ramesh A, Kumar S H, Foulds J, Getoor L. Weakly supervised models of aspect-sentiment for online course discussion forums. In: Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing. Beijing, China: ACL, 2015. 74?83
                      [36] Fan R E, Chang K W, Hsieh C J, Wang X R, Lin C J. LIBLINEAR: A library for large linear classiflcation. Journal of Machine Learning Research, 2008, 9(9): 1871?1874
                      [37] Kiritchenko S, Zhu X D, Mohammad S M. Sentiment analysis of short informal text. Journal of Artiflcial Intelligence Research, 2014, 50(1): 723?762
                      [38] Socher R, Perelygin A, Wu J Y, Chuang J, Manning C D, Ng A, Potts C. Recursive deep models for semantic compositionality over a sentiment treebank. In: Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing. Seattle, USA: ACL, 2013. 1631−1642
                      [39] Le Q V, Mikolov T. Distributed representations of sentences and documents. In: Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing. Seattle, USA: ACL. 2013: 1631?1642
                      [40] Tang D Y, Qin B, Liu T. Document modeling with gated recurrent neural network for sentiment classiflcation. In: Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. Lisbon, Portuga: ACL. 2015: 1422?1432
                      [41] Yang Z C, Yang D Y, Dyer C, He X D, Smola A, Hovy E. Hierarchical attention networks for document classiflcation. In: Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. San Diego, USA: ACL, 2016: 1480−1489
                    • [1] 薄迎春, 張欣, 劉寶. 延遲深度回聲狀態網絡及其在時間序列預測中的應用[J]. 自動化學報, 2020, 46(8): 1644-1653. doi: 10.16383/j.aas.c180264
                      [2] 陳加, 張玉麒, 宋鵬, 魏艷濤, 王煜. 深度學習在基于單幅圖像的物體三維重建中的應用[J]. 自動化學報, 2019, 45(4): 657-668. doi: 10.16383/j.aas.2018.c180236
                      [3] 李良福, 馬衛飛, 李麗, 陸鋮. 基于深度學習的橋梁裂縫檢測算法研究[J]. 自動化學報, 2019, 45(9): 1727-1742. doi: 10.16383/j.aas.2018.c170052
                      [4] 羅浩, 姜偉, 范星, 張思朋. 基于深度學習的行人重識別研究進展[J]. 自動化學報, 2019, 45(11): 2032-2049. doi: 10.16383/j.aas.c180154
                      [5] 張號逵, 李映, 姜曄楠. 深度學習在高光譜圖像分類領域的研究現狀與展望[J]. 自動化學報, 2018, 44(6): 961-977. doi: 10.16383/j.aas.2018.c170190
                      [6] 李文英, 曹斌, 曹春水, 黃永禎. 一種基于深度學習的青銅器銘文識別方法[J]. 自動化學報, 2018, 44(11): 2023-2030. doi: 10.16383/j.aas.2018.c180152
                      [7] 吳志勇, 丁香乾, 許曉偉, 鞠傳香. 基于深度學習和模糊C均值的心電信號分類方法[J]. 自動化學報, 2018, 44(10): 1913-1920. doi: 10.16383/j.aas.2018.c170417
                      [8] 田娟秀, 劉國才, 谷珊珊, 鞠忠建, 劉勁光, 顧冬冬. 醫學圖像分析深度學習方法研究與挑戰[J]. 自動化學報, 2018, 44(3): 401-424. doi: 10.16383/j.aas.2018.c170153
                      [9] 李飛, 高曉光, 萬開方. 基于權值動量的RBM加速學習算法研究[J]. 自動化學報, 2017, 43(7): 1142-1159. doi: 10.16383/j.aas.2017.c160325
                      [10] 張慧, 王坤峰, 王飛躍. 深度學習在目標視覺檢測中的應用進展與展望[J]. 自動化學報, 2017, 43(8): 1289-1305. doi: 10.16383/j.aas.2017.c160822
                      [11] 李敏, 禹龍, 田生偉, 吐爾根·依布拉音, 趙建國. 基于深度學習的維吾爾語名詞短語指代消解[J]. 自動化學報, 2017, 43(11): 1984-1992. doi: 10.16383/j.aas.2017.c160330
                      [12] 胡長勝, 詹曙, 吳從中. 基于深度特征學習的圖像超分辨率重建[J]. 自動化學報, 2017, 43(5): 814-821. doi: 10.16383/j.aas.2017.c150634
                      [13] 陳偉宏, 安吉堯, 李仁發, 李萬里. 深度學習認知計算綜述[J]. 自動化學報, 2017, 43(11): 1886-1897. doi: 10.16383/j.aas.2017.c160690
                      [14] 管皓, 薛向陽, 安志勇. 深度學習在視頻目標跟蹤中的應用進展與展望[J]. 自動化學報, 2016, 42(6): 834-847. doi: 10.16383/j.aas.2016.c150705
                      [15] 金連文, 鐘卓耀, 楊釗, 楊維信, 謝澤澄, 孫俊. 深度學習在手寫漢字識別中的應用綜述[J]. 自動化學報, 2016, 42(8): 1125-1141. doi: 10.16383/j.aas.2016.c150725
                      [16] 賀昱曜, 李寶奇. 一種組合型的深度學習模型學習率策略[J]. 自動化學報, 2016, 42(6): 953-958. doi: 10.16383/j.aas.2016.c150681
                      [17] 朱煜, 趙江坤, 王逸寧, 鄭兵兵. 基于深度學習的人體行為識別算法綜述[J]. 自動化學報, 2016, 42(6): 848-857. doi: 10.16383/j.aas.2016.c150710
                      [18] 奚雪峰, 周國棟. 面向自然語言處理的深度學習研究[J]. 自動化學報, 2016, 42(10): 1445-1465. doi: 10.16383/j.aas.2016.c150682
                      [19] 段艷杰, 呂宜生, 張杰, 趙學亮, 王飛躍. 深度學習在控制領域的研究現狀與展望[J]. 自動化學報, 2016, 42(5): 643-654. doi: 10.16383/j.aas.2016.c160019
                      [20] 郭瀟逍, 李程, 梅俏竹. 深度學習在游戲中的應用[J]. 自動化學報, 2016, 42(5): 676-684. doi: 10.16383/j.aas.2016.y000002
                    • 加載中
                    圖(7) / 表(10)
                    計量
                    • 文章訪問數:  159
                    • HTML全文瀏覽量:  75
                    • PDF下載量:  58
                    • 被引次數: 0
                    出版歷程
                    • 收稿日期:  2019-01-03
                    • 錄用日期:  2019-07-10
                    • 網絡出版日期:  2020-09-28
                    • 刊出日期:  2020-09-20

                    基于短文本情感增強的在線學習者成績預測方法

                    doi: 10.16383/j.aas.c190008
                      基金項目:  國家社會科學基金一般項目 (17BTQ061)資助
                      作者簡介:

                      華中師范大學計算機學院教授. 主要研究方向為學習分析和教育數據挖掘.E-mail: jmye@mail.ccnu.edu.cn

                      華中師范大學計算機學院碩士研究生. 主要研究方向為自然語言處理和教育數據挖掘. 本文通信作者.E-mail: 18140663659@163.com

                      華中師范大學計算機學院講師. 主要研究方向為軟件工程和學習分析.E-mail: chenshu@mail.ccnu.edu.cn

                    摘要: 當前利用短文本情感信息進行在線學習成績預測的研究存在以下問題: 1)當前情感分類模型無法有效適應在線學習社區的短文本特征, 分類效果較差; 2)利用短文本情感信息定量預測在線學習成績的研究在準確性上還有較大的提升空間. 針對以上問題, 本文提出了一種短文本情感增強的成績預測方法. 首先, 從單詞和句子層面建模短文本語義, 并提出基于學習者特征的注意力機制以識別不同學習者的語言表達特點, 得到情感概率分布向量; 其次, 將情感信息與統計、學習行為信息相融合, 并基于長短時記憶網絡建模學習者的學習狀態; 最后, 基于學習狀態預測學習者成績. 在三種不同類別課程組成的真實數據集上進行了實驗, 結果表明本文方法能有效對學習社區短文本進行情感分類, 且能夠提升在線學習者成績預測的準確性. 同時, 結合實例分析說明了情感信息、學習狀態與成績之間的關聯.

                    English Abstract

                    葉俊民, 羅達雄, 陳曙. 基于短文本情感增強的在線學習者成績預測方法. 自動化學報, 2020, 46(9): 1927?1940. doi: 10.16383/j.aas.c190008
                    引用本文: 葉俊民, 羅達雄, 陳曙. 基于短文本情感增強的在線學習者成績預測方法. 自動化學報, 2020, 46(9): 1927?1940. doi: 10.16383/j.aas.c190008
                    Ye Jun-Min, Luo Da-Xiong, Chen Shu. Short-text sentiment enhanced achievement prediction method for online learners. Acta Automatica Sinica, 2020, 46(9): 1927?1940. doi: 10.16383/j.aas.c190008
                    Citation: Ye Jun-Min, Luo Da-Xiong, Chen Shu. Short-text sentiment enhanced achievement prediction method for online learners. Acta Automatica Sinica, 2020, 46(9): 1927?1940. doi: 10.16383/j.aas.c190008
                    • 在線開放課程為世界各地的學習者提供了學習先進課程的機會, 同時還為教學管理者收集了各類數據以分析在線學習者的相關行為, 即所謂的學習分析[1]. 面對大規模的學習用戶及其所產生的數據, 如何對在線學習者的學業成績進行預測, 依據預測結果實施學業預警, 并為教學決策提供依據, 是在線教育需要解決的一個重要問題[2-9].

                      當前針對在線學習者成績預測的研究主要是利用學習者客觀的統計數據和學習行為數據, 對相關研究文獻進行歸納后, 本文將這些研究分為三個類別: 1)基于概率的成績預測研究; 2)基于傳統機器學習的成績預測研究; 3)基于深度學習的成績預測研究. 下面對這些研究工作進行闡述.

                      第一, 基于概率的成績預測研究包括知識追蹤(Knowledge tracing)和認知診斷(Cognitive diagnosis), 兩者都是使用學習者過去的學習表現數據, 利用概率模型刻畫學習者并預測其成績. 其中, 知識追蹤方法有貝葉斯知識追蹤(Bayes knowledge tracing, BKT)[10]和深度知識追蹤(Deep knowledge tracing, DKT)[11]兩類. 此外, 還有學者提出了基于動態記憶網絡的方法, 該方法學習知識點之間的關系和學習者對具體知識點的掌握情況, 從而對該學習者的學習表現進行預測[12]. 認知診斷模型分為連續型和離散型兩類, 其中連續模型的典型例子為潛在特質理論(Item response theory, IRT)[13], 而離散模型的典型例子為DINA (Deterministic inputs, noisy and gate model)[14]. 此外, 還有學者提出了一種通用的認知診斷框架, 能夠實現對主觀題和客觀題的認知建模, 增強了學習者成績預測的精度[15].

                      第二, 基于傳統機器學習的方法利用統計理論、聚類、分類、圖理論和矩陣因子化等技術預測學習者成績. Anderson等[16]對學習者的參與類型進行分類, 并研究了學習者的參與度及其成績之間的關聯. Ramesh等[17]提出用于抽象學習者參與類型的潛在表征模型, 以預測輟學率及學習者成績; Bayer等[18]利用學習者豐富的社交網絡數據預測其輟學率和學校課程的錯誤選擇; 矩陣因子化(Matrix factorization, MF)近年來也常被應用于教育領域的成績預測, Sweeney等[19]利用矩陣因子化等推薦系統的常見方法進行成績預測研究; Ren等[20]考慮了相關課程和時間因素的影響, 提出了一種時序課程影響的矩陣分解算法以預測學習者成績; Tang等[21]利用動態圖理論預測學習者行為(包括學習成績), 并取得了好的效果.

                      第三, 基于深度學習(Deep learning)的成績預測研究也越來越受到關注. 深度知識追蹤(DKT)技術利用遞歸神經網絡模擬學習者練習過程, 以預測其未來表現. 在此基礎上, 有多個工作探索了深度模型的層數、特征等因素對最終預測成績結果的影響[22-24]; Su等[25]結合文本語義信息提出了一種基于測驗文本的神經網絡方法來預測學習者的測驗成績; Feng等[26]提出了一種基于特征交互的神經網絡框架, 通過學習不同類型特征之間的關聯來預測學習者能否完成在線課程的學習.

                      從上述所闡述的內容, 可以發現這些研究忽視了學習者的短文本數據, 而這些數據保留了可用作學習者成績預測的大量信息, 這為我們的研究提供了新視角.

                      除研究視角選擇之外, 我們還發現短文本數據中的情感因素會對學習者的成績預測造成影響. 對此, Wen等[27]提出利用論壇中的短文本數據計算學習者的情感比率, 并研究了情感比率與學習者輟學行為之間的關系. 其研究結果表明: 積極的情感傾向預示著較低的輟學率; Tucker等[28]發現論壇短文本數據中蘊含的情感分數與學習者的測驗表現和作業投入有較強的相關性; Chaplot等[29]利用情感分析工具計算情感特征, 并與其他多個特征結合訓練神經網絡模型, 結果表明情感特征能夠提升成績預測的精度. 以上研究均顯示有效地利用情感信息將提高成績預測的準確性.

                      上述利用情感信息進行成績預測的研究還存在著如下問題: 1)多數研究工作采用傳統方法或是直接遷移其他領域(如商品評論分析)的情感分析方法來處理論壇中的短文本數據, 但這種做法不適應針對學習社區短文本數據的處理: Wen等[27]在研究中發現不同課程的短文本數據有不同語言表達特征, 如在文科性質的課程中, 部分被判定為帶有消極情緒的短文本所含有的消極詞匯與其評論的客觀事實相關, 與學習者情感無關; Wen等[27]還發現不同學習者的表達特征也影響著情感識別的效果, 如存在著某些學習者習慣性使用消極詞匯的情況, 所以不能僅依靠詞匯的極性判斷其情感極性. 這些問題的存在意味著, 如何設計能夠有效適應學習社區短文本特征的情感識別模型是一個有待研究的關鍵問題. 2)當前研究多是定性地說明情感因素的作用(如Wen等[27]和Tucker等[28]的工作), 而部分結合短文本情感信息定量預測學習者成績的工作所取得的效果也有待進一步提高(如文獻[29]的工作). 因此, 結合短文本情感因素, 構建情感增強的成績預測模型, 以有效地定量預測學習者成績, 這是本文有待研究的又一個關鍵問題.

                      針對上述問題1), 本文在分析在線學習社區短文本數據所具有的特征的基礎上, 考慮利用最新的自然語言處理方法[30-34]構建情感分類模型加以解決. 由于在線學習社區的短文本數據通常由多個短句構成, 這些短句具有一般短文本數據所共有的特點, 如表達隨意、語病多等. 所以本文的具體思路是: 為了有效地刻畫短文本的情感, 本文首先利用短文本數據訓練得到詞的語義表示, 隨后采用分層處理的策略處理這些短文本數據. 在這些分層中, 第1層從詞表示中聚合得到句子的語義表示, 而第2層從句子表示聚合得到短文本的語義表示. 在每一層中, 選擇廣泛用于建模文本語義的雙向長短期記憶(Bi-directional long short-term memory, BiLSTM)網絡模型作為每一層的處理結構. 同時, 利用注意力機制處理每一層BiLSTM的輸出, 以識別出對情緒分類貢獻較大的情感詞匯和包含情緒表達的句子. 其次, 在線學習社區中, 不同的課程和學習者具有不同的情感表達特征, 這會對情感分類任務產生重要影響. 為此, 本文改進了傳統注意力機制, 在注意力權重的計算過程中引入了學習者特征向量, 以實現學習不同學習者情感表達特點的目的. 同時, 在不同課程上, 訓練不同的情感分類模型, 以適應課程層面的情感表達特點.

                      針對上述問題2), 本文考慮到深度知識追蹤模(DKT)是一種基于循環神經網絡的方法, 在時序上可有效地建模學習者的學習狀態, 且由于DKT基于深度學習框架, 這可與短文本的情感表示有效結合, 所以本文選擇DKT作為成績預測模型的擴展基礎. 此外, 本文還注意到人口統計數據和學習行為數據對學習者成績預測的影響, 故將這兩者與短文本數據表示相融合, 以得到完整的學習者特征表示. 在此基礎上, 利用一種改進的長短期記憶(Long short-term memory, LSTM)循環神經網絡建模學習狀態, 以此為基礎預測學習者的成績.

                      本文的貢獻主要在于: 1)利用分層模型建模短文本語義, 并改進傳統注意力機制以識別不同學習者的語言表達特征; 2)設計了情感增強的學習者特征融合方法, 并利用LSTM網絡從時序上建模學習狀態, 預測學習成績.

                      • $ {n} $為在線學習者的個數, $ {V} $是在線學習者的集合, 有$ \left|{V}\right| = {n} $. 設一門在線課程包含$ {T} $個知識點, 并按照在線教學的時間順序進行安排. 具體定義如下.

                        定義1. 在線學習成績.設$ {y}\in[0,1]^{{n}} $為所有學習者的課程成績, 將學習者成績映射到[0, 1]的區間.

                        例如, $ {y}({i}) = 0.95 $為學習者$ {i} $的在線學習成績, 表示學習者$ {i} $的期末成績為百分制的95分.

                        定義2. 學習狀態. 設${z}^{t}({i}) = [{Z}_{i,t,0},{Z}_{i,t,1},\cdots, $${Z}_{i,t,m-1}]^{\rm{T}} $表示學習者$ {i} $在知識點$ {t} $上的學習狀態. 其中, $ {Z}_{i,t,j}\in [0,1] $, $ {m} $為學習狀態向量的維度, 將所有學習者的學習狀態存儲在$ {Z}\in[0,1]^{n \times T \times m} $中. $ {z}^{t}({i}) $ 中的每一個維度代表學習者在課程對應能力維度的掌握情況, 數值高代表其掌握較好, 數值低代表其掌握較差. 利用學習者在線學習產生的多種數據, 使用特定模型可以刻畫其學習狀態, 并利用此狀態預測學習成績.

                        例如, $ {z}^{t}({i}) = [0.3 , 0.5 , \cdots, 0.2]^{\rm{T}}\in [0,1]^{24} $為學習者$ {i} $在知識點$ {t} $上的學習狀態. 其維度為24維, 每個維度對應的元素數值越高表示對應能力維度掌握情況越好, 如數值為0.5的維度比數值為0.3的維度掌握情況要好.

                        定義3. 在線學習特征. 設${X}\in {\bf{R}}^{n \times T \times d}$表示在不同知識點下的所有在線學習特征. $ {x}_{t}({i}) = [{X}_{i,t,0} , $${X}_{i,t,1} , \cdots, {X}_{i,t,d-1}]^{\rm{T}}$表示學習者$ {i} $在知識點$ {t} $上的特征, 其中, $ {d} $為學習者特征向量的維度. $ {x}^{t}({i}) $由學習者的人口統計、學習行為和短文本情感這三類特征向量融合生成. $ {{{{f}}_{{g^t}(i)}}} $表示學習者$ {i} $在知識點$ {t} $上的人口統計特征; $ {{{{f}}_{{b^t}(i)}}} $表示學習者$ {i} $在知識點$ {t} $上的學習行為特征; ${{{sentiment}}_{{st^t}(i)}}$表示學習者$ {i} $在知識點$ {t} $上的短文本情感特征.

                        例如, $ {{{x}}^t} (i) = {[{{{sentimen}}{{{t}}_{{st^t}(i)}};{{{f}}_{{g^t}(i)}};{{{f}}_{{b^t}(i)}}}]} $為學習者$ {i} $在知識點$ {t} $上的在線學習特征, 符號“;”表示行序拼接. ${{{sentiment}}_{{st^t}(i)}}$通過情感分類模型獲取, $ {{{{f}}_{{g^t}(i)}}} $$ {{{{f}}_{{b^t}(i)}}} $通過日志數據計算得到.

                        基于上述定義, 本文要解決的基于短文本情感增強的在線學習者成績預測問題定義如下.

                        定義4. 基于短文本情感增強的在線學習者成績預測問題.

                        輸入. 所有學習者的特征表征$ {{X}} $;

                        輸出. 所有學習者的在線學習者成績表征$ {{y}} $.

                        其中, 輸入$ {{X}} $包含學習者$ {i} $在知識點$ {t} $的短文本信息$ {ST^t}({i}) $、人口統計信息$ {g^t} (i) $和學習行為信息$ {b^t}(i) $, 并可由此得到的學習者特征向量$ {{{x}}^t}(i) $; 輸出預測成績的過程即利用$ {{X}} $獲取學習者的學習狀態表征$ {{Z}} $, 并通過$ {{Z}} $預測學習者的在線學習者成績表征$ {{y}} $.

                        針對定義4中的問題, 本文基于自然語言處理方法和深度學習理論, 設計了一種基于短文本情感增強的在線學習成績預測方法, 具體如圖1所示.

                        圖  1  基于短文本情感增強的在線學習行為預測方法框架

                        Figure 1.  Short-text sentiment enhanced achievement prediction method for online learners framework

                        該預測方法框架中的核心工作為: 1)在研究在線學習社區短文本特征的基礎上, 提出一種在線學習社區短文本情感分類模型, 以獲取到短文本情感分布向量$ {{{sentiment}}_{{st^t}(i)}} $; 2)從學習者的基礎信息中獲取到人口統計特征向量$ {{{{f}}_{{g^t}(i)}}} $, 同時, 從其學習行為數據中獲取到學習行為特征向量$ {{{{f}}_{{b^t}(i)}}} $; 3)將短文本情感分布向量$ {{{sentiment}}_{{st^t}(i)}} $、人口統計特征向量$ {{{{f}}_{{g^t}(i)}}} $和學習行為特征向量$ {{{{f}}_{{b^t}(i)}}} $相融合, 獲取情感增強的在線學習者特征$ {{{x}}^t} (i) $, 這可更加完整地刻畫出學習者的特征; 4)針對每個時間步, 本文將不同知識點的在線學習特征$ {{{x}}^t} (i) $作為LSTM模型的輸入, 該模型可產生學習者在不同時刻的學習狀態$ {{{z}}^t} (i) $; 5)基于學習者的最終學習狀態$ {{{z}}^T} (i) $預測學習者的在線學習成績$ {{y}} (i) $. 其中, 步驟1)將在第2.1節中描述, 步驟$2)\sim 5) $將在第2.2節描述.

                      • 針對現存情感分類模型無法有效適應在線學習社區短文本的特征, 且分類效果較差的問題, 本文設計一種在線社區短文本情感分類模型, 如圖2所示. 基于文獻[33]的工作, 本文首先利用短文本數據訓練得到詞的語義表示, 隨后采用分層處理的策略處理這些短文本數據. 在這些分層中, 第一層為句子向量表示層, 從詞表示聚合得到句子向量表示, 而第二層為短文本向量表示層, 從句子表示聚合得到短文本的語義表示. 在這些層次中, 使用BiLSTM作為每一層的語義建模結構, 利用注意力機制識別出對情緒分類貢獻較大的情感詞匯和包含情緒表達的句子. 同時, 本文改進了傳統注意力機制, 即在注意力權重的計算過程中引入了學習者特征向量, 以實現學習不同學習者情感表達特點的目的. 下面具體描述該模型.

                        圖  2  在線學習社區短文本表示模型

                        Figure 2.  Sentiment classification model for online learning community short text

                      • 首先描述該短文本情感分類模型的輸入. 設每個學習者$ {i} $在知識點$ {t} $上發表的短文本數據為$ {{ {st}}^t}( i ) = $$ \{ {{s_1}, \cdots ,{s_p}} \}, $其中, ${{ s}_j} = \{ {{w_{j1}},\cdots ,{w_{jLj}}}\}$表示短文本中的一個句子, $ {w_{{j^ * }}} $表示句子$ {j} $中單詞, $ L_j $表示句子$ {j} $的長度.

                        利用課程短文本數據訓練詞嵌入模型[34], 并利用此模型得到每個句子的詞向量表示${{{s}}_j} = \{ {{w}_{j1}},\cdots ,$${{w}_{jLj}}\}$.

                      • 針對句子向量表示層, 將每個句子$ {{{s}}_j} $中的詞向量使用BiLSTM模型進行處理, 由此得到句子$ {s}_j $中每個單詞在建模后的語義表示$ {{{h}}_{jq}} $, $ {q} \in [ {1,{L_j}}] $. 同時, 從學習者的角度看, 由于并非所有詞都能平等地反映出學習者的情緒或重要性. 為了解決這個問題, 本文使用結合學習者特征向量的注意力機制來提取句子中不同詞對學習者的重要性, 并通過加權的方式聚集得到句子的向量表示$ {s}_j $, 具體計算過程為

                        $$ {{{s}}_j} = \sum\limits_{q = 1}^{{L_j}} {{\alpha _{jq}}{{{h}}_{jq}}} $$ (1)

                        其中, $ {\alpha_{jq}} $是句子$ {j} $中單詞$ {q} $對于學習者$ {i} $的重要性權重; $ {{{h}}_{jq}} $是BiLSTM層$ {q} $時刻的隱藏狀態. $ {\alpha _{jq}} $利用式(2)計算, 其涉及的得分函數r利用式(3)計算.

                        $$ {a_{jq}} = \frac{{\exp \left(r\left({{{h}}_{jq}},{{l}}\right)\right)}}{{\sum\limits_{{{o}} = 1}^{{L_j}} {\exp \left(r\left({{{h}}_{jo}},{{l}}\right)\right)} }} $$ (2)
                        $$ r\left({{{h}}_{jq}},{{l}}\right) = {{v}}_w^{\rm{T}}\tanh \left({{{W}}_{wh}}{{{h}}_{jq}} + {{{W}}_{wu}}{{l}} + {{}_w}\right) $$ (3)

                        其中, r為得分函數, $ {{{v}}_w} $是計算單詞重要性得分的向量; $ {{l}} $是學習者$ {i} $的特征向量; $ {{{W}}_{wh}} $$ {{{W}}_{wu}} $是單詞層面的權值矩陣; $ {{}_w} $是單詞層面的偏置向量.

                      • 針對短文本向量表示層, 將每個句子向量$ {{{s}}_j} $使用BiLSTM層進行處理, 可得到各個句子建模后的語義表示$ {{{k}}_q} $, $ q \in [ {1,p} ] $, 以用于計算短文本的向量表示. 同理, 短文本中的不同句子向量表示$ {{\bf{s}}_j} $對學習者的重要性也是不同的. 所以, 在句子層面利用結合學習者特征向量的注意力機制以得到不同句子的重要性, 然后通過加權的方式得到所有句子的聚合表示. 同時, 為了讓最終的短文本向量表示的維度不要過大, 以造成對情感分類的影響, 本文對聚合得到的短文本向量再施加一個線性變換和sigmod函數, 以得到最終的短文本向量表示$ {{{st}}^t}( i ) $. 具體為

                        $$ {\beta _q} = \frac{{\exp \left(r\left({{{k}}_q},{{l}}\right)\right)}}{{\sum\limits_{{{o}} = 1}^p {\exp \left(r\left({{{k}}_o},{{l}}\right)\right)} }} \qquad\qquad\qquad\quad$$ (4)
                        $$ r\left({{{k}}_q},{{l}}\right) = {{v}}_s^{\rm{T}}{\rm{tanh}}\left({{{W}}_{sh}}{{{k}}_q} + {{{W}}_{su}}{{l}} + {{}_s}\right) $$ (5)
                        $$ {{{st}}^t}(i) = {\rm{sigmod}}\left({{{W}}^0}\left(\sum\limits_{q = 1}^p {{\beta _q}{{{k}}_q}} \right) + {{}^0}\right) $$ (6)

                        其中, 式(4)用于計算不同句子的重要性權重, $ {\beta_q} $是不同句子對于學習者$ {i} $的重要性. 式(5)用于計算不同句子的重要性得分, r為得分函數; $ {{{k}}_q} $是BiLSTM層$ {q} $時刻的隱藏狀態; $ {{{v}}_s} $是計算句子重要性得分的向量; $ {{l}} $是學習者$ {i} $的特征向量; $ {{{W}}_{sh}} $$ {{{W}}_{su}} $是句子層面的權值矩陣; $ {{}_s} $是句子層面的偏置向量. 式(6)用于計算最終的短文本向量表示; $ {{{W}}^0} $是文檔層面的權值矩陣; $ {{}^0} $是文檔層面的偏置向量.

                      • 在獲取到短文本的向量表示$ {{{ st}}^t}(i) $之后, 需輸出基于此得到的該短文本屬于不同情感類別的概率, 并定義其損失函數, 具體為

                        $$ {{{ sentiment}}_{s{t^t}(i)}} = {{p}}= {\rm{softmax}}\left({{{W}}^1}{{{st}}^{_t}}(i) + {{}^1}\right) \qquad$$ (7)
                        $$ loss = - \sum\limits_{S{T^t}(i) \in TD} {\sum\limits_{c = 1}^C {{{p}}^r_c\left(S{T^t}(i)\right) \times \ln \left({{{p}}_c}\left({{{st}}^t}(i)\right)\right)} } $$ (8)

                        其中, $ {C} $為本文設置的情感類別個數, 具體在實驗中介紹; $ {{p}}\in{[{0,1}]^C} $是表示在$ {C} $ 個不同情感類別的概率分布的向量; $ {{{W}}^1} $是線性變換的權重矩陣; $ {{}^1} $是線性變換的偏置向量; 通過softmax函數可得到$ {{{ st}}^t}(i) $$ {C} $ 個不同情感類別上的分布概率; $ {TD} $表示訓練集; $ {{{p}}^r} $$ {st^t}( i) $真實的情感類別向量, 該向量只有在短文本屬于的情感類別對應的位置的值為1, 其余值為0.

                      • 針對當前利用短文本情感信息預測學習者的成績的研究存在準確性不高的問題, 本文基于DKT設計了短文本情感增強的成績預測模型. 此模型分為三層, 第1層為學習者特征構建, 將短文本情感向量$ {{{sentiment}}_{{st^t}(i)}} $與人口統計向量$ {{{{f}}_{{g^t}(i)}}} $和學習行為向量$ {{{{f}}_{{b^t}(i)}}} $相融合, 得到情感增強的學習者特征向量$ {{{x}}^t}( i) $. 第2層為學習狀態建模, 利用改進的循環神經網絡LSTM建模學習狀態$ {{{z}}^t}(i) $. 第3層為成績預測, 基于期末時刻的學習狀態向量${{{z}}^{{\rm{T}}}}( i)$預測學習者的成績$ {{y}}(i) $. 具體方法如圖3所示.

                        圖  3  學習狀態建模與成績預測過程

                        Figure 3.  Learning state modeling and achievement prediction process framework

                      • 要建模學習者的學習狀態, 首先要獲得學習者特征的完整表示. 本文在2.1節中可得到短文本情感特征向量$ {{{sentiment}}_{{st^t}(i)}} $, 同時, 基于學習者的基礎數據和學習行為數據可以得到學習者的人口統計特征向量$ {{{{f}}_{{g^t}(i)}}} $和學習行為特征向量$ {{{{f}}_{{b^t}(i)}}} $. 通過多源特征融合函數fuse可得到學習者的完整特征表示$ {{{x}}^t}( i ) $, 具體做法為

                        $$ {{{x}}^t}(i) = fuse\left({{{sentiment}}_{{st^t}(i)}},{{{{f}}_{{g^t}(i)}}},{{{{f}}_{{b^t}(i)}}}\right) $$ (9)

                        其中, $ {{{{f}}_{{g^t}(i)}}} $$ {{{{f}}_{{b^t}(i)}}} $分別為學習者$ {i} $在知識點$ {t} $的人口統計特征向量和學習行為特征向量. 本文利用了文獻[21]中提及的人口統計特征和學習行為特征構建$ {{{{f}}_{{g^t}(i)}}} $$ {{{{f}}_{{b^t}(i)}}} $, 其中, $ {{{{f}}_{{g^t}(i)}}} $主要由年齡、性別和教育水平等8 個與人口統計相關的特征構成, $ {{{{f}}_{{b^t}(i)}}} $主要由投入在觀看視頻上的時間、在論壇中的發言次數和回復次數等16 個與學習行為相關的特征構成. fuse函數可以有多種選擇形式, 本文采用向量拼接進行融合, 即$ {{x}^t}( i ) = [ {{{sentiment}}_{{st^t}(i)}};{{{{f}}_{{g^t}(i)}}};$${{{{f}}_{{b^t}(i)}}} ] $, 其中, 符號“ ; ”表示向量按行序拼接.

                      • 因為學習是一個連續的過程, 所以僅有每個獨立時間步的特征表示是不夠的. 學習過程中某一時間步的學習狀態不僅與當前時間步的行為相關, 且受之前的學習狀態與表現的影響, 所以需要有效地建模學習者在不同時刻的學習狀態并刻畫這些狀態之間的影響. 基于此, 本文提出采用可有效處理時間序列問題的LSTM模型來建模學習者在不同時間步的學習狀態.

                        LSTM能很好模擬學習者的學習過程, 首先, 在特定時間步$ {t} $, 存在學習者前一時間步的實際學習狀態$ {{{z}}^{t - 1}}(i) $和當前時間步的學習特征$ {{ x}^t}(i) $, 在沒有其他因素影響時, 通過式(10)可以計算當前時間步學習者的隱含學習狀態$ {{{c}}^{'t}}(i) $.

                        $$ {{c}}{'^t}(i) = \tanh \left({{{W}}_c}\left[{{{z}}^{t - 1}}(i);{{{x}}^t}(i)\right] + {{}_c}\right) $$ (10)

                        其中, $ {{{W}}_c} $是權值矩陣; $ {{}_c} $是偏置向量; 其次, 考慮學習過程的記憶和遺忘因素, 通過計算輸入門$ {{{i}}^t}(i) $和遺忘門$ {{{f}}^t}(i) $更新當前時間步學習者的隱含學習狀態$ {{{c}}^t}(i) $, 具體更新如式$(11)\sim (13) $所示.

                        $$ {{{f}}^t}(i) = \sigma \left({{{W}}_f}\left[{{{z}}^{t - 1}}(i);{{{x}}^t}(i)\right] + {{}_f}\right) $$ (11)
                        $$ {{{i}}^t}(i) = \sigma \left({{{W}}_i}\left[{{{z}}^{t - 1}}(i);{{{x}}^t}(i)\right] + {{}_i}\right) $$ (12)
                        $$ {{{c}}^t}(i) = {{{f}}^t}(i) \circ {{{c}}^{t - 1}}(i) + {{{i}}^t}(i) \circ {{c}}{'^t}(i) $$ (13)

                        其中, $ {{{W}}_ * } $是權值矩陣; $ {{}_ * } $是偏置向量; $ \circ $ 表示向量對應元素相乘操作; 遺忘門控制從上個時間步的隱含學習狀態中遺忘的內容, 輸入門控制從當前隱含狀態中記憶的內容, 二者共同作用達到對當前隱含學習狀態進行更新的目的. 最后, 考慮學習者隱含學習狀態并不能完全展現出來(如受到緊張等因素影響), 通過計算輸出門$ {{{o}}^t}( i) $得到當前時間步學習者的實際學習狀態, 具體為

                        $$ {{{o}}^t}(i) = \sigma \left({{{W}}_o}\left[{{{z}}^{t - 1}}(i);{{{x}}^t}(i)\right] + {{}_o}\right) $$ (14)
                        $$ {{{z}}^t}(i) = {{{o}}^t}(i) \circ \tanh ({{{c}}^t}(i)) \qquad\qquad $$ (15)

                        其中, $ {{{W}}_o} $是權值矩陣; $ {{}_o} $是偏置向量; 輸出門控制隱含學習狀態轉化成實際學習狀態的內容.

                      • 通過學習狀態建模, 可以得到學習者在不同知識點對應時間步的實際學習狀態. 基于最后時刻學習者的學習狀態向量$ {{{z}}^{T}}( i ) $便可以預測學習者的課程成績, 即可利用一個單層的MLP預測其課程成績, 具體預測方法為

                        $$ grade(i) = sigmod\left({{{W}}^2}{{{z}}^{ T}}(i) + {^2}\right) $$ (16)

                        其中, $ {grade}(i) $表示所預測得到的第$ {i} $個學習者的課程成績, $ {{{W}}^2} $是線性變換的權重向量, $ {^2} $是偏置. 最后, 成績預測模型的損失函數為

                        $$ loss = -\sum\limits_{i \in Course} {\left(grade(i) - grade^r(i)\right)^2} $$ (17)

                        其中, $ {grade^r}(i) $是學習者真實的課程成績.

                      • 本文選擇在真實的MOOC學習數據集上進行實驗, 以驗證本文方法的有效性. 實驗分兩部分進行說明, 第1部分說明短文本情感分類模型在學習社區文本數據上的有效性, 第2部分說明成績預測的實驗結果及分析.

                      • 本文收集了學堂在線上國內某知名大學MOOC平臺上的學習行為數據集. 該數據集包括了2013年秋季學期和2014年春季學期的11 門完整的在線課程相關數據. 這些課程可分為3 類: 工科(如計算機科學與電子工程)、理科(如物理)和文科及其他(如歷史和體育); 每門課程都設有論壇, 學習者可針對不同知識點的教學內容發布問題或回復他人提出的問題, 因此該數據集為本文提供了研究所需的短文本數據. 除此之外, 該數據集還包含了與學習者相關的人口統計學信息, 以及多種類型的學習者活動信息(如觀看視頻、完成作業、下載資源等). 表1$\sim $4描述了該數據集的相關統計數據, 主要包含課程的類別和數目、每類課程的平均人數和知識點上的平均發帖數、每類課程的情感類別分布情況和文章所使用的人口統計特征與學習行為特征.

                        表 1  不同類別課程的數量

                        Table 1.  Number of different types of courses

                        課程類別 課程 合計課程數量數量 (門)
                        工科 計算機科學, 電子工程 5
                        理科 物理 2
                        文科及其他 歷史,體育 4

                        表 4  模型部分使用的特征

                        Table 4.  Part features used in the model

                        特征類別 特征個數 部分特征
                        統計特征 8+ 性別、年齡、教育層次、相關先行課成績等
                        學習行為特征 16+ 發帖次數、被回帖次數、觀看教學視頻時間、知識點測驗成績等

                        表 2  不同類別課程的人數及發帖數量

                        Table 2.  Number of people and post in different type courses

                        課程類別 平均學習者人數 (人) 每個知識點下的發/回帖數量 (個)
                        工科 2 326 3 200
                        理科 2 681 1 520
                        文科及其他 2 170 1 060

                        表 3  不同類別課程的情感類別分布

                        Table 3.  Distribution of sentiment categories in different type courses

                        課程類別 情感類別分布 (約簡為整數), 積極/消極/疑惑/正常情緒 (%)
                        工科 16/14/37/33
                        理科 21/19/27/33
                        文科及其他 29/12/22/37

                        由于收集到的短文本數據缺乏情感類別信息, 因此需要對其類別進行標注. 文獻[27-29]和文獻[35]均將學習社區文本數據分為積極、消極和一般這樣的三個情感類別來進行成績預測的分析和研究. 本文在此基礎上將情感中的一般類別細分為“疑惑”和“正常情緒”, 最終將學習社區短文本的情感類別確定為積極、消極、疑惑和正常情緒四類.

                        為了充分驗證本文短文本模型的有效性, 采用人工標注短文本的情感類別. 具體做法為: 1)由5 個教育數據挖掘方向的研究生獨立標注短文本情感類別, 此標注的FLeiss Kappa指標為0.782; 2)如果短文本被4人以上標注為某一類別, 可將此短文本確定為此類別; 3)無法通過步驟2標注類別的短文本通過5人討論確認其類別.

                      • 本文在實驗中選擇了最佳超參數設置, 由于篇幅限制而省去針對短文本情感分類模型的超參數選擇過程.

                      • 收集每門課程中的學習者在知識點的論壇版塊中已發表的短文本數據, 以形成每門課程獨立的短文本數據集. 通過隨機分割, 本文將課程中的80%短文本數據用于做訓練, 將10%短文本數據用于做驗證, 將剩余10%的短文本數據用于做測試. 使用準確性(Accuracy, ACC)指標評價模型在情感分類模型上的整體表現, 并用均方根誤差(Root mean square error, RMSE)指標評價預測的情感標簽和真實情感標簽上的分離程度. 兩個測評指標的計算為

                        $$ { Accuracy_{{\rm{sentiment}}}} = \frac{T}{N} \qquad\qquad\quad $$ (18)
                        $$ RMS{E_{{\rm{sentiment}}}} = \sqrt {\frac{{\sum\limits_{o = 1}^N {({s_o} - {{s^r}_o})^2} }}{N}} $$ (19)

                        其中, T表示短文本情感預測正確的個數; $ {N} $為測試中的短文本的總個數; $ {s^r_o} $$ {o} $對應短文本的真實情感標簽; $ {s_o} $是預測的情感標簽.

                        在超參數設置上, 利用Glove方法在課程短文本數據集上訓練200 維度的詞向量; 設置學習者的特征向量為200 維, 使用標準正態分布U(0.01, 0.01)進行初始化; 將BiLSTM模型的隱藏節點個數設置為100, 即其可輸出200 維向量; 將短文本表示向量的維度設置為50; 設每個短文本最多含有40 個句子, 且每個句子的長度不超過 50 個單詞; 采用Adam方法優化整體模型的參數, 并設置初始化學習率為0.005.

                      • 基于第3.2.1節的設置, 本文在課程短文本數據集上進行了訓練和測試, 并選擇如下方法加以對比, 下面是對所選擇方法的概述: 1) Trigram: 提取短文本中的unigrams, bigrams和trigrams 等特征訓練支持向量機(Support vector machine, SVM)分類器用于短文本的情感分類[36]; 2) TextFeature: 提取短文本中的word/character n-gram、sentiment lexicon、cluster type等特征訓練SVM分類器用于短文本的情感分類[36]; 3) SSWE: 學習短文本中的情緒特化詞向量表示, 并將每個句子單詞的詞向量使用max/min/average pooling等池化操作處理之后作為短文本的表示, 訓練一個SVM分類器用于短文本的情感分類[37]; 4) RNTN + RNN: 利用遞歸神經張量網絡(Recursive neural tenser network, RNTN)獲取句子表示, 然后將其輸入遞歸神經網絡(Recurrent neural network, RNN), 最后對RNN的每個時間步的隱向量進行平均后得到短文本表示, 訓練情感分類模型[38]; 5) Paragraph vector: 利用Distributed memory model of paragraph vectors學習短文本表示, 再使用隱藏層和softmax函數得到情感分類的結果[39]; 6) DMGRNN: 使用CNN (Convolutional neural network)/LSTM得到句子的表示, 然后利用雙向GRU (Gated recurrent unit)得到短文本表示, 訓練情感分類模型[40]; 7) HAN: 使用層次BiLSTM和注意力機制學習句子和短文本表示, 再使用隱藏層和softmax函數得到情感分類的結果[41]. 具體對比結果如表5$\sim $7所示.

                        表 5  工程類課程的情感分類結果

                        Table 5.  Sentiment classification results of engineering courses

                        方法 ACC RMSE
                        Trigram 0.373 1.754
                        TextFeature 0.415 1.789
                        SSWE 0.353 1.976
                        RNN + RNN 0.432 1.673
                        Paragraph Vector 0.379 1.834
                        DMGRNN 0.506 1.394
                        HAN 0.532 1.281
                        本文方法 0.573 1.185

                        表 7  文科及其他類課程的情感分類結果

                        Table 7.  Sentiment classification results of no-science courses

                        方法 ACC RMSE
                        Trigram 0.549 0.814
                        TextFeature 0.562 0.811
                        SSWE 0.568 0.864
                        RNN + RNN 0.585 0.806
                        Paragraph Vector 0.578 0.772
                        DMGRNN 0.650 0.685
                        HAN 0.677 0.633
                        本文方法 0.706 0.584

                        表 6  理科類課程的情感分類結果

                        Table 6.  Sentiment classification results of science courses

                        方法 ACC RMSE
                        Trigram 0.543 0.822
                        TextFeature 0.556 0.850
                        SSWE 0.550 0.851
                        RNN + RNN 0.580 0.786
                        Paragraph Vector 0.556 0.821
                        DMGRNN 0.644 0.696
                        HAN 0.674 0.652
                        本文方法 0.693 0.628

                        對比結果說明如下:

                        1)由于Trigram方法和TextFeature方法僅基于短文本的語言特征, 故在這三類數據集上都呈現出較差的結果. 這說明了學習社區短文本數據具有缺乏語法規范、含有大量語病等特點, 這對基于語言特征的方法影響較大. 此外, 采用深度學習的方法也并不都表現良好, 前三類深度學習方法的表現甚至還不如傳統方法, 這說明短文本情感分類問題的困難性.

                        2) DMGRNN方法和HAN方法的效果明顯較好. 這兩者共同的改進是應用了層次結構, 這說明分別從單詞層面和句子層面分層處理短文本能夠有效地捕捉其中的情緒特征. 使用了注意力機制的HAN方法與DMGRNN方法相比, 前者的效果較好, 這說明了使用注意力機制發現與情緒相關的單詞和句子對結果有顯著的影響.

                        3)本文所提出的短文本表示模型在6 個指標都取得了最好的效果. 這是因為除了使用層次BiLSTM機制和注意力機制之外, 本文的模型方法還在建模的過程中把學習者向量結合進來, 具體表現為在計算注意力機制的權重時利用了學習者特征向量. 由于考慮到個體學習者在表達情緒上的習慣是不同的, 相似的詞語或者句子可能由于其表達者的不同而蘊含的情緒完全相反, 本文的情感分類模型可很好地學習到這一點.

                        4)實驗顯示針對工科課程短文本數據進行分類的效果, 明顯低于其他兩類的課程, 其中突出的一個表現是將積極或消極情感誤分類為正常情緒類別. 對此原因, 本文的分析是: a)工科類課程的短文本數據的表達更加隨意, 如: 表達無語法規范, 常含有未登錄詞匯, 混雜有公式或符號等問題. 通過對一門計算機課程、一門物理課程和一門體育課程進行是否存在明顯語法問題(影響語義理解)的標注發現: 計算機課程存在明顯語法問題短文本的比例達到16.34%, 另外兩門課程分別為8.87%和5.56%, 工科類課程存在明顯的隨意性. 這種隨意性會影響模型對語義的理解, 此問題可以通過文本糾錯和修復方法緩解, 使得情感分類模型受輸入噪聲的影響降低. b)工科類課程積極類情感或消極類情感的表達常與具體問題的描述相交錯, 這使得模型易產生混淆. 解決此問題的途徑是改進模型結構, 在分層提取情緒特征的基礎上引入句子間的邏輯信息以輔助模型理解短文本語義.

                      • 為了去除參與論壇討論頻率過低的學習者對預測模型的影響, 每門課程中只選取發表短文本數量處于前80%的學習者作為成績預測實驗的對象. 學習狀態表征向量的維度$ {m} $設置為24, 該超參數的選擇過程將在第3.3.2節介紹. 本文將百分制的分數換算到[0, 1]區間, 并在11 門課程上進行了成績預測實驗. 每門課程使用80%的學習者數據用于做訓練, 使用20%的數據用于做測試. 訓練時, 每次將其中128 個學習者作為一批并進行模型訓練, 當訓練1 000 次迭代后, 預測模型會趨于穩定. 本文采用標準準確性(Accuracy)和均方根誤差(RMSE)作為測評指標, 具體計算為

                        $$ { Accuracy_{\rm{grade}}} = \frac{{{T_{[ -a, + b]}}}}{N} $$ (20)

                        其中, $ {T_{[ -a, + b]}} $表示預測分數和學習者真實成績的差距在該區間范圍之內的學習者個數, 實驗中ab都選取為0.03, $ {N} $為測試集中的所有學習者個數.

                        $$ { RMSE_{\rm{grade}}} = \sqrt {\frac{{\sum\limits_{o = 1}^N {{{({g_o} - g^r_o)}^2}} }}{N}} $$ (21)

                        其中, $ {g_o} $表示學習者預測的成績, $g^r_o$表示學習者真實的成績.

                      • 基于第3.3.1節的設置, 在課程學習者數據集上進行了訓練和測試. 由于本文所用數據集不滿足認知診斷方法和知識追蹤方法的要求, 故選取多種傳統機器學習方法作為對比方法. FM[19]是一種基于矩陣分解的方法, 近年來廣泛應用于成績預測, 所以選擇其作為對比方法. 同時, 由于LadFG[21]方法被證明優于大多的基于深度學習方法, 所以本文也將該方法作對比方法. 同時, 為了在所列出的表中比較方便,將本文的方法命名為SEAP (Short-text sentiment enhanced achievement prediction method for online learners).

                        下面是所選對比方法的概述: 1)由于傳統機器學習本質上是一種基于特征的方法, 首先介紹本文使用的特征: 針對每個學習者, 提取其對應第2.2節中的人口統計特征$ {{{{f}}_{{g^t}(i)}}} $、不同知識點下的學習行為特征的均值Mean$( {{{{f}}_{{b^t}(i)}}} ),\;{t}= 0,\cdots,{T} $和整個學習過程中的短文本數據被預測為不同情感類別的占比sentiment$ ({i} ). $利用以上特征訓練不同的機器學習模型, 具體為MR?、MR+、MLP?、MLP+、XGBoost?和XGBoost+. 其中, MR為多變量回歸模型, MLP為僅有一個隱層的神經網絡, XGBoost是一種基于決策樹的集成模型, 負號表示模型中不使用情感因素, 正號表示模型中使用情感因素. 2) FM[19]: 構造學習者?課程矩陣, 將學習者在對應課程的成績作為矩陣元素. 利用矩陣因子化的方法得到學習者和課程的特征向量, 基于特征向量預測學習者的成績. 3) LadFG[21]: 利用學習者的人口統計數據、學習行為數據構建動態圖模型, 基于學習者整個過程的學習狀態預測學習者成績. 具體比較結果如表8$\sim $10所示.

                        表 8  工科類課程的成績預測結果

                        Table 8.  Achievements prediction results of engineering courses

                        方法 Accuracy RMSE
                        MR? 0.566 0.479
                        MR+ 0.590 0.452
                        MLP? 0.583 0.464
                        MLP+ 0.603 0.437
                        XGBoost? 0.679 0.335
                        XGBoost+ 0.697 0.284
                        FM 0.674 0.326
                        LadFG 0.818 0.226
                        SEAP 0.874 0.095

                        表 10  文科及其他類課程的成績預測結果

                        Table 10.  Achievements prediction results of no-science courses

                        方法 Accuracy RMSE
                        MR? 0.648 0.409
                        MR+ 0.664 0.336
                        MLP? 0.652 0.340
                        MLP+ 0.688 0.307
                        XGBoost? 0.701 0.281
                        XGBoost+ 0.743 0.269
                        FM 0.726 0.222
                        LadFG 0.874 0.154
                        SEAP 0.924 0.051

                        表 9  理科類課程的成績預測結果

                        Table 9.  Achievements prediction results of science courses

                        方法 Accuracy RMSE
                        MR? 0.598 0.430
                        MR+ 0.612 0.419
                        MLP? 0.618 0.408
                        MLP+ 0.643 0.372
                        XGBoost? 0.689 0.295
                        XGBoost+ 0.709 0.278
                        FM 0.687 0.295
                        LadFG 0.803 0.203
                        SEAP 0.902 0.084

                        對比結果說明如下: 在表8$\sim $10中, 與比其他方法相比, 本文方法與LadFG方法具有較好的效果. FM方法僅利用學習者的成績數據, 無法很好地刻畫學習者整體的學習行為. MR?、MLP?和XGBoost?方法僅考慮到了不變的人口統計學特征和整個課程學習行為的平均數值, 不能很好地反映學習者在整個學習過程中學習狀態的變化. MR+、MLP+ 和XGBoost+ 在前三種方法的基礎上增加了情感因素, 效果上取得了一定的提升, 說明情感因素對于成績預測重要作用. 本文方法與LadFG方法都在時序上考慮學習者的多種特征, 能夠學習其在不同時刻的學習狀態變化, 均取得了較好的效果, 說明了本文使用LSTM進行時序化建模的有效性. 同時, 本文方法使用了短文本情感因素, 既利用到了學習者的客觀信息(如人口統計信息和行為信息), 又學習了學習者的主觀因素, 從而更細致地刻畫出學習者的學習狀態變化.

                        除了進行方法效果的對比實驗外, 本文還比較了3類特征在本文模型中的貢獻, 相關實驗結果如圖4所示.

                        圖  4  不同特征對任務的貢獻

                        Figure 4.  Contribution of different features for tasks

                        圖4所示, 若三類課程在減少相應的特征之后, 則表現出了相同的變化趨勢: 若減少人口統計信息, 對預測效果的影響最小, 因為這類特征在各學習時刻是基本不變的, 無法反映個體學習的差異; 若減少了學習行為特征對預測的影響是最大的, 因為此類特征是學習者學習狀態最重要的體現; 若將短文本情感分類特征移除之后, 預測的效果平均降低了15%, 表明了短文本數據中所包含的情感因素, 對此任務具有重要貢獻.

                        同時, 本文也在11 門課程上進行了不同$ {m} $值下的模型效果比較實驗, 圖5為在$ {m} $不同的情況下的平均表現, 可以看出: 當$ {m} $值為24左右的時候, 模型可達到最好的效果; 若增加$ {{m}} $的維度, 則出現預測效果不斷的降低, 這可能與數據稀疏性有關.

                        圖  5  不同的m對任務的影響

                        Figure 5.  Contribution of different m for tasks

                      • 本文對于學習者狀態的建模采用LSTM模型, 每個學習者在不同知識點上的學習狀態儲存在LSTM不同時間步的隱藏狀態中. 為了分析學習狀態與學習成績之間的關聯, 以驗證學習狀態建模的重要意義, 本文選取計算機課程的一門課程為例: 在測試集上計算不同成績等級的學習者在最后一個知識點對應LSTM時間步所隱含狀態的均值向量, 結果如圖6所示.

                        圖  6  學習狀態與成績的關系

                        Figure 6.  Relationship between learning status and achievement

                        圖6中淺色部分表示相關維度數值較低, 深色部分表示相關維度數值較高. 可以看出: 1)成績在[0, 60]之間的學習者在各個維度的學習狀態的得分值都偏低, 說明此類學習者對各個知識點的掌握情況都比較差. 2)成績在[60, 90]之間的學習者在$ {m} $3, $ {m} $8, $ {m} $16, $ {m} $17和$ {m} $22這些維度的得分值較高, 并隨著成績的提升, 相關維度的值也呈現上升趨勢; 通過追蹤這些維度變化時發現, 該成績段的相關維度都是在課程進行到后期時開始增加的, 因此可推測其代表屬于課程中較難知識點的學習狀態. 這也從另一個側面驗證了對課程中的難點掌握較好的學習者能取得更好的學業成績. 3)成績處于[90, 100]學習者在所有維度都取得了較高的得分值, 這印證此類學習者對各個知識點的掌握均較好, 因此其成績也是最好的一類.

                        從以上實驗可以說明學習狀態與學習成績之間的重要關聯. 同時, 為了說明情感因素與學習狀態之間的關聯, 本文選取同樣一門計算機課程中的兩個相鄰的知識點(時間步), 記作$ {t} $1和$ {t} $2, 統計積極情感屬于不同概率區間的學習者的學習狀態變化. 由于涉及的學習狀態維度較多, 本文關注上一個實驗中與成績高度相關的$ {m} $3, $ {m} $8, $ {m} $16, $ {m} $17和$ {m} $22, 具體如圖7所示.

                        圖  7  學習狀態呈現正向變化的學習者占區間總學習者的比率(積極情感)

                        Figure 7.  The ratio of learners who have a positive change in learning status to the total learner in the interval (positive emotions)

                        圖7所示, 本文依據$ {t} 2$時刻學習者在積極情感上的預測概率, 將學習者劃分到(0.9, 1], (0.7, 0.9], (0.5, 7], (0, 0.5]四個區間, 并統計各個區間內的學習者在$ {m} $3, $ {m} $8, $ {m} $16, $ {m} $17和$ {m} $22五個學習狀態維度上學習狀態呈現正向變化(對應學習狀態維度$ {t}2 $時刻的數值大于$ {t} 1$時刻的數值)的學習者占區間總學習者的比率. 從結果上可以看出, 當概率處于[0.5,1]區間時, 積極情感占主導地位, 通常表明學習者的學習狀態呈現正向變化. 此時學習者學習情緒積極, 學習對應知識點較為順利, 也愿意投入到學習活動中(可能表現為積極參加討論和觀看視頻). 同時, 有部分學習者表現出較高的積極情緒, 卻呈現負向變化, 原因可能是其在另外兩類特征上表現不佳, 如知識點測驗分數較低或是先行課程成績較差. 當概率處于[0, 0.5]區間時, 消極、疑惑或是正常情緒三類情感占主導地位, 大部分的學習者的學習狀態呈現負向變化. 此時學習者學習情緒不夠積極, 學習對應知識點有一些困難. 但是, 在情緒不高時部分學習者的學習狀態依然呈現正向變化, 可能的原因是這部分學習者希望通過提問來加強對知識點的理解或是其習慣表達消極情緒, 但在知識點的學習上同樣投入較多的時間.

                      • 1)在短文本情感分類層面上, 本文將文獻[33]中的模型應用于在線學習者的情感分析, 本文方法與其主要區別為: a)二者的應用領域不同, 文獻[33]針對電商平臺評論數據, 本文模型針對在線學習社區短文本數據; b)二者分類的情緒類別不同, 本文模型識別積極、消極、疑惑和正常情緒四種學習社區常見的情感類別; c)二者均采用層次化處理方法, 但是本文模型利用學習者特征改進注意力機制, 并在不同課程上獨立進行訓練; 文獻[33]采用與用戶、商品相關的特征和多任務學習等方式改進模型.

                        2)在利用短文本情感信息進行成績預測層面上, 文獻[27]和[28]僅是從定性的角度說明情緒與成績之間的關系, 而本文與文獻[29]從定量角度利用情緒信息預測學習者的成績, 本文與文獻[29]的主要區別為: a)文獻[29]使用通用的情感分類模型提取情感信息, 本文設計了針對在線學習社區的短文的情緒分類模型, 本文方法能夠更好地提取情緒信息; b)文獻[29]使用傳統人工神經網絡處理包含情緒特征在內的學習者特征預測成績, 本文則設計了多種特征的融合方法, 并采用長短時記憶網絡建模從時序上處理學習特征, 從而預測學習者成績.

                        3)在成績預測的層面上, 本文是基于深度學習的成績預測方法, 與當前此領域的方法主要的區別在于: a)設計了針對在線學習社區的短文本情感分類模型, 提取情感信息并將其與其他特征相融合; b)區別于傳統DKT結構, 本文僅利用RNN網絡的最后一個時間步的隱含狀態進行成績預測; c)本文設計了實例分析, 說明情感、學習狀態與成績之間的關聯.

                      • 本文提出了一種短文本情感增強的在線學習者成績預測方法. 首先, 基于在線學習社區短文本的特征設計了情感分類模型, 基于此模型得到短文本的情感特征向量; 其次, 將短文情感信息、學習行為信息和統計信息相融合, 并利用LSTM建模學習者的學習狀態; 最后, 基于學習狀態預測學習者的成績. 通過在真實數據集上的實驗驗證了本文提出的短文本分類模型在在線學習社區的文本上有很好的情感分類效果, 利用短文本情感信息能有效提升在線學習成績預測的精度. 同時, 本文的方法還有一定的提升空間, 具體表現在: 1)繼續探索更佳的短文本情感分類模型, 使得短文本情感信息更好地應用于成績預測任務; 2)本文的方法本質上是一種基于深度學習的方法, 其可解釋性較差, 可以將認知診斷和知識追蹤結合進本文的框架, 增強在線行為預測的可理解性. 這些方向將在未來的工作中進行研究.

                    參考文獻 (41)

                    目錄

                      /

                      返回文章
                      返回