《战略信息系统杂志》
1.理解和衡量技术实现的正式沟通质量:预期阶段的测试
摘要:成功地向员工介绍新技术对管理者来说仍然是一项关键而富有挑战性的任务。实践者和学术研究指出了正式沟通在技术实施成功中的关键作用。我们开发了一个衡量正式沟通质量的量表,并使用三个预期工作中出现新技术的专业人士样本来评估其影响。以用户适应的应对模式为依据,考察了技术实施项目预期阶段正式沟通质量对员工认知、情绪和与同事沟通意愿的直接和间接影响,为新技术的应用做好准备。研究结果验证了我们将正式沟通概念化为一个二阶形成性构念,并将四个内容领域(即什么、如何、为什么和何时)的信息质量作为一阶维度。我们的研究结果证实了正式沟通作为一种管理影响机制的作用,在预期阶段积极影响员工对新IT的初步评价。对新IT的评价引发了情绪,而这种情绪反过来又激励员工向他人寻求意见和友情,以此作为适应新IT的一种手段。我们的事后分析说明了正式沟通质量、信念、情绪和应对意图之间的关系的动态性质。我们的工作通过提高正式沟通质量的可操作性、扩展当前对寻求社会支持的理解以及揭示预期阶段法理学网络中关系的时间动态的新见解,为文献做出了贡献。经过验证的正式沟通量表对于希望评估其沟通有效性并评估其对员工适应影响的管理者来说是一个有用的工具。
《信息处理和管理》
1.基于区块链的分布式存储技术分类
摘要:分布式系统为可扩展性和高可用性问题提供了解决方案。许多分布式存储技术是通过区块链基础设施出现的。基于区块链的存储系统为P2P系统带来了一个新的视角。评估基于区块链的分布式存储系统需要特定的分类法。近年来,计算机环境中存储的数据量显著增加。数量的增长使得在一台服务器上存储和处理大量数据变得非常困难。分布式存储技术正被用来解决单个服务器上的可伸缩性和高可用性等问题。分布式存储技术通过使用相关的管理方法,发展了在多个节点上处理和服务数据的过程。后来,通过在新的区块链技术上执行分布式存储策略,开发了新的存储基础设施。然而,文献缺乏一种方法来检查利用这种新的基于区块链的分布式技术的解决方案。在本文中,据我们所知,我们提出了第一个基于区块链的分布式存储技术的分类和分类。使用建议的分类法检查、比较和评估最新的解决方案。
2.深度神经网络与文献计量指标相结合的新兴研究课题预测
摘要:预测新出现的研究课题对研究者和决策者都很重要。在这项研究中,我们提出了一个两步解决方案的问题,新兴话题预测。第一步以时间序列的方式预测候选主题的未来流行度得分,这是一个反映影响和增长的新指标。第二步从第一步预测的热门候选人中选择新颖的主题。具有领域特征的术语被用作候选主题。应用深度神经网络,特别是LSTM和NNAR,结合主题的九个特征来预测流行度得分。我们从两个角度评估了两个数据集上的模型和五条基线,即:(1)预测正确的指标值和(2)重建最佳排序顺序的能力。比较了两种类型的训练策略,包括训练包含所有主题的模型的全局策略和训练包含不同主题组的单独模型的两种局部策略。我们的结果显示,LSTM和NNAR在预测MAE和RMSE测量的受欢迎度得分值方面优于其他模型,而LightGBM是一个竞争性的基线,在[电子邮件保护]方面对主题进行排序。全球和本地策略的性能差异不显著。将该方法预测的新兴话题与其他方法预测的新兴话题进行了比较。对指定新兴主题的定性评估表明,机器学习方法指定的主题比基于规则的模型指定的主题更相似。根据初步的文献分析,提出了一些重要的课题。这项研究利用了机器学习和文献计量指标两种方法的优势来预测新出现的主题。深度神经网络用于定义和测量目标优化目标。文献计量指标提供了一种从候选文献中选择新颖主题的有效方法。这种混合方法在进行预测时考虑了新兴主题的各种特征,显示出良好的应用前景。
3.利用多模态数据的一致性检测虚假新闻
摘要:在年新冠状病毒(nCoV)爆发期间,假新闻的传播引起了严重的社会恐慌。假新闻往往利用文字、图像等多媒体信息误导读者,传播和扩大其影响力。在基于多模态数据的假新闻检测中,一个重要的问题是提取假新闻的一般特征,同时融合假新闻的固有特征,如图像与文本的不匹配、图像篡改等。本文提出了一种多模态一致性神经网络(MCNN),它考虑了多模态数据的一致性,并捕捉了社会媒体信息的整体特征。该方法由五个子网组成:文本特征提取模块、视觉语义特征提取模块、视觉篡改特征提取模块、相似度度量模块和多模态融合模块。文本特征提取模块和视觉语义特征提取模块分别负责提取文本和视觉的语义特征,并将它们映射到同一空间,共同表示跨模态特征。视觉篡改特征提取模块负责提取视觉物理特征和篡改特征。针对图像与文本不匹配的问题,相似度度量模块可以直接度量多模态数据的相似度。我们根据四个常用于假新闻检测的数据集来评估所构建的方法。与现有的最佳方法相比,检测的准确度有了明显的提高。
4.用于联合实体和事件提取的全局归一化神经模型
摘要:利用神经网络从文本中提取事件是近年来研究的热点。然而,现有的方法在单独的分类器中准备候选参数时存在错误传播问题,无法对实体提及和事件结构之间的相关性进行建模。为了提高实体识别和事件提取的性能,我们提出了一种基于转换的联合神经网络模型,将图形结构转换为一组转换动作。特别地,我们设计了十种新的动作,并引入了一种全局标准化策略来缓解标签偏差问题。我们在广泛使用的自动内容抽取(ACE)语料库上进行了实验,结果表明,我们的模型在实体上的F1得分为88.7%,在事件触发器上的F1得分为75.3%,大大优于基线神经网络。进一步的深入分析表明,我们的模型在捕捉长句中的结构依赖方面是有效的。所提出的模型可用于促进一系列下游任务。
5.面向电子商务网络推荐的异构实体表示学习
摘要:提出了一种新的异构类型的实体表示方法,设计了一种基于混合翻译的关系嵌入方法进行评级预测,提出了一种基于实体特征的可解释策略,用户和产品的类型和属性信息包含丰富的语义,有利于用户对感兴趣项目评分的预测和解释。现有的研究包括协作和基于内容的推荐,这些推荐主要通过考虑用户-项目交互或行为历史记录来捕获语义特征,而忽略了产品类型和属性的解释作用。在本文中,我们首先提出了一个注意属性和交互方法来模拟用户和项目的语义嵌入。然后我们构造一个类型特定的矩阵来利用异构类型特定的信息来学习用户和项目表示。合并的异构类型信息有助于捕获用户的潜在特征,从而解决推荐系统中用户-项目交互的稀疏性问题。此外,通过基于用户和项目类型特定表示的翻译机制预测节点的等级关系。在真实数据集上的大量实验结果表明,该模型比现有的几种方法具有更高的性能,并显示了电子商务推荐系统中评级行为的视觉可解释性。
6.基于特征密度的网络欺凌自动检测分类器训练效率的提高
摘要:特征密度可用于减少所需的实验迭代次数..一般来说,特征密度似乎与分类器性能呈负相关,依赖结构可能作为神经网络中的特征存在,数据集的复杂度不能单独用特征密度来衡量,语言预处理可以提高分类器的性能为了估计数据集的复杂度,采用了不同的语言支持的特征预处理方法,并在训练前对机器学习分类器的潜在性能进行了比较评估。我们假设,估计数据集的复杂性可以减少所需的实验迭代次数。通过这种方法,我们可以优化ML模型的资源密集型训练,这正成为一个严重的问题,由于可用数据集规模的增加和日益流行的基于深度神经网络(DNN)的模型。对更强大的计算资源的需求不断增加的问题也影响到环境,因为大规模ML模型的训练导致二氧化碳排放量惊人地增长。这项研究是在多个数据集上进行的,包括流行的数据集,例如用于训练典型情绪分析模型的Yelpbusinessreview数据集,以及最近试图解决网络欺凌问题的数据集,这是一个严重的社会问题,从语言表征的角度来看,这也是一个复杂得多的问题。我们使用多语言收集的网络欺凌数据集,即英语、日语和波兰语。数据集语言复杂性的差异使我们可以进一步讨论语言支持的词预处理的有效性。
7.利用文献中的资源引文信息改进在线科学资源分析
摘要:我们首先开发了科学文献中的资源引文信息,建立了资源引文分析的注释方案和数据集,建立了术语提取和关系提取任务的联合模型,提出了一个构建多个以资源为中心的网络的自动化系统在线科学资源评测任务,旨在更好地理解和总结在线科学资源,促进资源搜索和推荐系统的发展。为此,我们建议通过提取被引用的在线资源与其他与资源相关的科学术语之间的细粒度关系来开发科学文献中的资源引用信息。在本文中,我们创建了一个数据集(SciResTR)并开发了一个框架(SciResTR-IE),它联合提取所有相关的科学术语和资源术语关系。大量的实验表明,我们的框架在科学信息提取任务中比其他基线显著地提高了5%左右。我们进一步证明,我们提出的系统可以从大量的科学论文中自动构建多个以资源为中心的网络,这是利用文献中的资源引文信息来改进在线科学资源分析的第一步。
8.稀疏可解释文本表示的神经变分稀疏主题模型
摘要:提出了一种稀疏可解释文本表示的SR-NSTM模型,将SR-NSTM模型推广到具有最大后验边界约束的有监督学习任务中,实验结果表明,该模型在复杂度、主题连贯性和文本分类准确率等方面都具有优越性,文本是网民的主要信息载体,从中学习潜在表征具有重要的研究和实用价值。神经主题模型已经被提出,并且在提取可解释的潜在主题和文本表示方面有很好的表现。然而,这些方法存在两大局限性:(1)由于前馈网络结构较浅,一般忽略了文本的上下文信息,特征表示能力有限;(2)忽略了主题语义空间中表示的稀疏性。针对这些问题,本文提出了一种面向可解释稀疏潜在文本表示学习的语义强化神经变分稀疏主题模型(SR-NSTM)。与现有的神经主题模型相比,SR-NSTM采用神经网络参数化的概率分布模型对文本的生成过程进行建模,并结合双向LSTM在文档级嵌入上下文信息。它实现了零均值拉普拉斯分布的文档和词的稀疏后验表示,以及具有稀疏极大值的主题的稀疏后验表示。此外,我们提出了一种SR-NSTM的监督扩展,通过加入最大裕度后验正则化来处理监督任务。利用神经变分推理方法对模型进行有效学习。在Web片段、20个新闻组、BBC和生物医学数据集上的实验结果表明,上下文信息和重新访问生成过程可以提高性能,从而使我们的模型在学习连贯主题和可解释的文本稀疏表示方面具有竞争力。
9.系统故障演化过程中模糊逻辑关系的识别与确定
摘要:提出了系统故障演化过程和空间故障网络理论的概念,参照柔性逻辑中的14种逻辑关系,将其转化为事件发生逻辑关系式,作为基本逻辑关系;后者采用枚举法改变模糊隶属度,当适应度函数最接近0时,得到最优模糊隶属度,给出了模糊逻辑结构函数的具体形式,利用神经网络确定了因果事件之间的模糊逻辑关系;给出了算法分析框图和步骤。该方法能有效地解决系统故障演化过程中事件间模糊逻辑关系的确定问题,提出了一种将基本逻辑关系与模糊隶属度叠加形成模糊逻辑关系表达式的方法。它被称为模糊逻辑结构函数。确定模糊逻辑结构函数需要解决两个问题。一是确定基本的逻辑关系;二是确定模糊隶属度。将14种柔性逻辑关系转化为事件发生逻辑关系公式,作为基本逻辑关系;后者采用枚举法改变模糊隶属度,当适应度函数最接近0时得到最优模糊隶属度,最后得到模糊逻辑结构函数的形式。利用神经网络确定原因事件和结果事件之间的模糊逻辑关系。通过实例可以看出,因果事件之间的逻辑关系是蕴涵和平均的,其模糊隶属度在80%以上;在使用神经网络时,模糊隶属度没有实际意义,但通过原因事件概率可以更准确地得到结果事件概率。最后总结了该方法的优缺点。
10.用户定义的SWOT分析-从用户生成内容的变化挖掘角度
摘要:基于客户意见和体验的用户生成内容(UGC)日益成为一种丰富的商机资源。本研究针对传统SWOT分析的主要缺点,提出了一个变革挖掘框架,包括定义因素的主观性、缺乏实证验证、难以适应变化的环境、缺乏可操作的步骤等。从Amazon.