用户健康信息素养与问答文本情感特征对在线健康社区问答采纳影响分析

时间:2023-10-01 16:30:06 来源:网友投稿

吕健超,林 萍

(1 南京邮电大学 管理学院,南京 210003;
2 中国电信股份有限公司南京浦口分公司,南京 210000;
3 江苏高校哲学社会科学重点研究基地——信息产业融合创新与应急管理研究中心,南京 210003)

近年来,在线健康社区成为人们获取医疗信息的重要途径,在线健康社区的问答板块中,用户进行信息搜索、交互、分享、采纳等行为[1]。虽然在线健康社区为人们提供了海量的数据信息,但是其信息质量参差不齐,一方面是由于在线健康社区没有完善的审核机制,导致回答者回复随意,回答质量不尽人意;
另一方面是在线健康社区的专业性较强,患者受其文化程度或者信息水平限制,在表述过程中出现了偏差,使得医护人员的回答并没有切中要点,回答满意度降低,信息采纳率下降。在线健康社区中回答的质量受到了广泛关注,但是很多忽略了提问的质量,问题表述生硬,态度甚至偏激,无疑为医患沟通带来了阻碍,因此健康信息素养在信息采纳过程中所起的作用,成为当前亟需关注的研究点。

在线健康社区通过医疗健康信息共享、社交支持和情感交互,在信息和情感层面提升用户的满意度。患者在在线健康社区中除了希望获取自身所需的信息支持外,也渴望得到心理支持,希望被理解并且得到精神上的安慰和鼓励,因此平台中医护人员提供适度的情感表达关怀可以获得用户的信任,建立温暖的情感社区文化也可以拉近用户与平台的距离,增强平台吸引力,提高平台用户粘性。研究表明,情感因素是影响用户选择最佳答案时的重要因素[2]。因此本文从文本的角度提取信息质量特征和信息源可信度特征,考虑在线健康社区中情感因素对于回答采纳的调节作用。

1.1 健康信息素养定义

健康信息素养(Health Information Literacy,HIL)的概念由美国医学图书馆协会融合了信息素养和健康素养的概念首次提出,是指意识到健康信息需求,确认健康信息来源并应用其检索相关信息,评估健康信息质量及其可用性[3]。2016 年卫生部发布新版《健康素养66 条》首提健康信息素养,指出其内涵是个体获取、理解、甄别、应用健康信息的能力[4]。现有研究往往将信息素养作为对于信息获取后的工作,但是信息交互是相互的,信息表达也是一种健康信息素养。国内外对于健康信息素养的测评工具很多,Baker[5]等提出包括50 个项目的阅读理解测试和17 个项目的计算测试,作为成人功能性健康素养测评工具;
欧光忠[6]提出包括健康信息意识、健康信息知识和健康信息能力3 个一级指标、9 个二级指标和39 个三级指标作为糖尿病患者健康信息素养评价指标体系。基于上述研究成果,本文将“结合自己病情,并通过语言礼貌详细的表达描述”作为用户的健康信息素养,具体包括健康咨询文本的表达水平、详细度、标点数、礼貌性、句子数、多样性。

1.2 健康信息情感特征研究

Stockdale[7]指出在线医疗社区满足了用户的表达、获取精神支持与实现个人价值等需求,对用户心理有正面影响;
Zhang[8]等研究结果表明,高影响力用户作为长期会员,在乳腺癌论坛中充当了信息提供者的角色,并且在参与的话题中表达了更多的鼓励和同情;
Wu[9等基于全球糖尿病论坛的数据集进行为期5 年的研究,发现该论坛中拥有较高活跃度的用户对社区体验有较高的满意度,拥有更多经验和偏激情感的用户发布的帖子在社区中起着重要作用;
李长荣[10]等对在线健康社区用户的发帖和回帖文本进行情感分析和计算,发现用户的活跃度与情感表达强度之间存在正相关关系;
邵佳[11]等针对青年大学生群体,发现不同情感状态下,大学生用户的查询方式、跟踪策略、信息使用行为特征不同;
李旭光[12]等在4 个疾病类贴吧中选取32 个帖子进行编码分析,发现个人想法陈述、除病情外,个人信息陈述及治疗经验分享对负面情绪向正面情绪转化有促进作用,信息内容和信息系统的各项要素对大学生用户健康信息查询的情感体验具有较强的反馈作用;
董伟[13]等从用户交互性和评论情感倾向出发,利用PageRank 等算法分析发现,在线健康社区中用户的影响力不同,表达的情感类别和强度会存在差异。

1.3 健康信息素养研究

健康信息素养的研究多与用户的行为有关。贺建平[14]等针对老年人群研究,发现电子健康信息素养对信息寻求行为具有显著影响,明确了疾病大流行环境中健康信息素养和寻求社会支持对健康信息的媒体使用意向的重要价值;
艾文华[15]等研究发现电子信息素养对健康信息规避行为的负向作用最大,知识或技能的缺乏也可能会导致个体不愿意做出行为上的改变、进而增加不确定性,做出回避与健康相关信息的决策;
陈忆金[16]等对12 名健康类短视频使用者进行访谈,探究人们健康类短视频有用性的影响因素,发现高电子健康信息素养和高健康信息需求程度群体更倾向于从中心路径评估健康类短视频的信息有用性。

综上研究,学界对于健康信息素养和情感特征研究取得了一定的进展,但是依然存在不足:

(1)在线健康社区中用户的健康素养评价较少,更多是通过问卷调查,使用测评工具对健康信息素养从主观上进行度量,无法全面反映在线用户健康素养真实情况;

(2)现有研究基于信息采纳视角,对医护人员的文本情感特征探究较少。当前,在线情感特征多聚焦于用户的影响力,从患者的角度研究较多,但是信息交互是双向的,对于不同程度健康焦虑用户,医护人员回答的文本情感信息对于信息采纳的影响也十分重要。

2.1 基础模型构建

1989 年Sussman 等[17]整合了Davis[18]提出的信息技术接受模型(TAM)和Petty[19]提出的精细加工可能性模型(ELM),并在此基础上构建了信息采纳模型(IAM)。IAM 模型是一种信息采纳影响因素模型,采用两种路径研究信息对接收者态度的影响,即中心路线和边缘路线,中心路线表示信息质量,边缘路线是指信息可信度。本文以回复文本结构特征和情感特征表征信息质量,以医护人员的专业权威表征信息可信度,并选择文本情感特征和咨询用户的健康信息素养作为调节变量,建立了在线健康社区信息采纳模型,模型如图1 所示。

图1 在线健康社区信息采纳模型Fig.1 Online health community information adoption model

2.2 指标构建与研究假设

2.2.1 问答文本特征

部分学者在线数据分析健康社区的问答采纳,比如曾宇颖[20]等聚焦医护人员特征,分析发现回复频次、开通服务数量、医学职称、学术职称、信息披露程度和感谢信数量会影响问诊用户对医护人员回复的采纳;
苗富[21]等基于“寻医问药”数据,认为文本长度、问答比、文本熵、感谢数、最佳回答数、回答总数、回答时序、回答时差、知识大众化程度、回答权威排序、回答详细度会影响问答采纳。本研究借鉴在线社区问答和专业健康社区问答,提出假设:

H1:表达水平对信息采纳具有正向影响;

H2:表达详细度对信息采纳具有正向影响;

H3:表达丰富度对信息采纳具有正向影响;

H4:礼貌用语对信息采纳具有正向影响;

H5:句子数量对信息采纳具有正向影响;

H6:表达多样性对于信息采纳具有正向影响。

2.2.2 医护人员专业权威

信息源的可靠性作为IAM 的边缘路线对信息采纳的影响一直受到学界的关注。本研究结合在线健康社区的具体情况,将医护人员的等级职称、擅长领域作为医护人员专业权威的指标,表征信息源可信度,提出假设:

H7:回答医护人员的等级职称对用户信息采纳具有正向影响;

H8:回答医护人员的专业契合度对用户信息采纳具有正向影响。

2.2.3 用户健康信息素养特征

Kobayashi[22]认为健康信息素养特征是根据获取的健康信息做出个体认为正确的判断和抉择,从而达到维持自身健康与促进健康水平发展的一种能力;
张艳茹[23]等认为青少年健康信息素养与信息行为存在积极的作用。本研究认为健康信息素养特征基于用户的表达特征,包括专业性、丰富性、完整性、礼貌用语、详细程度等。

信息服务质量的高低会很大程度影响用户对信息的采纳,但是优质的表达也是医护人员提供高信息质量的前提,当患者的表述越清晰,医护人员越可能“对症下药”,提供高质量的回答。本文提出假设:

H9:健康信息素养在表达详细性与信息采纳之间起显著的正向调节作用;

H10:健康信息素养在表达多样性与信息采纳之间起显著的正向调节作用。

2.2.4 表达情感特征

近年来,在线健康社区的情感表达受到了学者的关注。情感支持影响人们的健康生活质量,Zhao[24]等认为表达负面情感且具有高影响力用户,在收到他人的回帖后,会表现出较高的积极情感;
Oh[25]等邀请了护士、图书馆员以及相关用户,根据10 个标准对Yahoo!Answers 中的400 个健康类问答进行评估,发现自信、礼貌、同情等社会情感支持类标准对于信息质量的影响最大,而且社会情感支持类的标准在3 类人群中一致性最高,说明社会情感支持在社会化的问答社区中是一种共识性的影响因素;
姜雯[26]在信息质量自动化评价中,将情感作为特征,有效提高预测的准确率,可见情感特征在信息采纳中作为一项重要指标。本文做出如下假设:

H11:表达情感强度对用户信息采纳有正向影响;

H12:表达情感强度在表达详细性与信息采纳之间起显著的正向调节作用;

H13:表达情感强度在表达多样性与信息采纳之间起显著的正向调节作用。

3.1 数据收集

基于中国居民面临的最主要疾病报告,并听取GL 医院医护人员的临床问诊建议,选取心脏病、高血压等共15 类网民最为关注的疾病作为数据采集文本的主题。通过python 爬取寻医问药健康平台回答板块,具体内容包括问答文本、用户的性别、年龄\悬赏金额、医护人员的等级职称、医护人员的擅长领域、采纳标签,共计获取12 400 条问答,剔除异常值和重复值,最终获取12 149 条问答数据。

3.2 变量设计

结合相关文献研究及在线健康社区实际的文本信息,本文从问答文本特征、医护人员专业权威、情感表达特征、健康信息素养特征4 个方面,对文本数据计算分析,进行信息特征提取。其中,问答文本特征、医护人员专业权威、情感表达特征作为自变量,情感表达特征、健康信息素养特征作为调节变量,见表1。

表1 指标对应变量说明Tab.1 Description of the corresponding variables of the indicators

3.3 分析结果

3.3.1 指标筛选

本文首先通过相关性分析和共现诊断,剔除冗余指标。相关性分析采用相关系数矩阵计算,通过计算两两变量之间的Pearson 相关系数形成相关系数矩阵,对用户健康信息素养评价,对提问的文本特征指标进行计算分析,见表2。共线性分析使用方差膨胀系数(Variance Inflation Factor,VIF)和容差指标计算,VIF 是衡量共线性严重程度的一种度量,表示当系数估计量的方差与假设自变量间不线性相关时,两者方差相比的比值,容差等于1/VIF。一般情况下,当VIF 大于10 时表示变量间存在严重多重共线性,见表3。将以上各指标进行归一化处理,并求平均值,作为用户健康信息素养的数值。

表2 提问相关系数矩阵Tab.2 Question correlation coefficient matrix

表3 提问共线性统计Tab.3 Question collinearity statistics

同理,对医护人员回答的文本特征、健康信息素养进行相关性和共线性分析,相关性矩阵见表4,回答共线性统计见表5,句子数量和表达丰富度的VIF均大于10,因此予以剔除。

表4 回答文本特征相关系数Tab.4 Correlation coefficients of response text features

表5 回答共线性统计Tab.5 Answer collinearity statistics

3.3.2 回归分析

因为信息采纳是二分类变量,包括采纳与不采纳,因此使用Logistic 二元回归模型对二分类因变量(即y =1 或y =0)进行回归分析,应用最普遍的多元量化分析方法。被用于描述二分类变量和一个或者多个自变量之间的关系,模型表达式如式(1):

其中,P(Y =1)表示对于给定的x选择1 的概率,F(z)表示累计概率密度函数。

Y通过Logistic 函数被转换为概率,式(2)。

其中,P为采纳的概率;
n为协变量个数;
β1,β2,…,βn为各自的回归系数;
x1,x2,…,xn为信息采纳的影响因素。

由于回复文本的表达详细度和表达多样性是体现医护人员是否全面、详细解答用户疑虑的指标,因此,在探究用户健康信息素养和回复文本情感表达强度交叉效用时,本文选择评估健康信息素养、表达情感强度和表达详细度、表达多样性交叉效用。具体模型包括:模型一:信息质量特征+信息源特征;
模型二:模型一+健康信息素养交叉效用;
模型三:模型二+表达情感强度交叉效用;
模型四:模型一+健康信息素养交叉效用+表达情感强度交叉效用。使用SPSS25 软件进行Logistic 回归分析,结果见表6。

表6 健康信息采纳影响因素分析结果Tab.6 Analysis results of influencing factors of health information adoption

第一,由于共线性诊断删除冗余指标,假设H3和H5 不予验证。第二,假设H1 和H4 不成立,表达水平中重复出现主题词和礼貌用语,文本冗长,无法快速、精准消除用户健康疑虑。第三,假设H2 不成立,模型中表达详细度显著性不断变化,且呈负向影响;
假设H7 不成立,医护人员的等级职称负向影响用户信息采纳;
假设H8 成立,即医护人员专业契合度一直正向影响用户的信息采纳。可见,对信息采纳的影响,并不是表达的越详细、医护人员等级职称越高越受到用户的喜爱,相反,用户更倾向于选择精练、专业度高的健康信息。第四,假设H6 成立,表达多样性对问答信息采纳有正向影响;
假设H11 不成立,即表达情感强度对用户信息采纳影响呈现波动状态;
假设H12 和H13 不成立,情感强度和多样性会产生负向交叉效用,情感强度和详细度交叉效用不显著。这进一步说明,医护人员应尽可能全面回答用户健康需求,同时应使用中性词语回复,平抚用户的焦虑、准确传达疾病诊断结论,提高用户对回复文本的理解和采纳。第五,假设H9 和H10 不成立,用户健康信息素养并不能影响问答的信息采纳,尽管健康疾病回答中涉及较多医学术语,用户健康信息素养较低,信息表达可能不尽如人意,但是医护人员有丰富的问诊经验,可以快速、准确识别不同健康信息素养人群的健康信息需求,可以提供令用户满意并且采纳的答案,因此,在信息采纳影响因素中,用户健康信息素养并没有显著影响力。

区别于一般问卷调查从主观角度对信息采纳的影响因素进行分析,本文立足于专业健康社区平台,考虑医患双方的信息交互过程,通过文本分析对健康信息素养和回答情感特征进行量化,着重对健康信息素养、情感特征影响因素进行研究;
使用经典的二分类回归模型对健康信息素养和情感特征在信息采纳中的调节作用进行探索。

基于本文研究结果,从健康平台和医护人员角度,提出以下建议:

从医护人员的角度,医护人员在回答患者问题时,应当注意情感用词,大多患者在寻医问药平台寻求更多的是情感支持,医护人员应尽可能对患者提供有用信息的同时注意心理和精神上的支持。

从平台的角度,平台设立信息推送机制,为那些健康信息素养高的,特别是表达水平强的患者,推送注重人文关怀且比较细致的医生,可以极大提高平台的采纳率。

猜你喜欢医护人员特征文本根据方程特征选解法中学生数理化·中考版(2022年9期)2022-10-25文本联读学概括 细致观察促写作云南教育·小学教师(2022年4期)2022-05-17南平市妇联关爱援鄂医护人员家属海峡姐妹(2020年3期)2020-04-21在808DA上文本显示的改善制造技术与机床(2019年10期)2019-10-26不忠诚的四个特征当代陕西(2019年10期)2019-06-03基于doc2vec和TF-IDF的相似文本识别电子制作(2018年18期)2018-11-14抓住特征巧观察数学小灵通·3-4年级(2017年9期)2017-10-13帮助医护人员处理好四种关系中国卫生(2016年7期)2016-11-13文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻小学教学参考(2015年20期)2016-01-15精神科医护人员职业倦怠相关分析中国健康心理学杂志(2015年6期)2015-09-05

推荐访问:在线 问答 健康