检索连续的语块之一: WS ConCord词丛功能 词丛( word cluster) 是几个连续的单词, 重复出现的 次数很多, 有点类似于语块, 但又不等同于语块。
基于28个网页-相关网页
Word Cluster Map 生成词汇聚类地图
co-word cluster analysis 共词聚类分析
word cluster vector space 单词类向量空间
word initial cluster 现的辅音连缀
Secondly, clusters all the words in the corpus into 1024 clusters automatically. Then the word cluster will be added to the feature template, thus solve the problem of data sparseness to some extent.
在本文的标注方法中,首先利用最大熵模型进行词性标注作为一个基准,然后利用了聚类方法自动地对语料中的词语进行聚类,形成1024个词簇,并把它们作为特征加入到基准模型中,从而有效地缓解了特征的数据稀疏问题;本文采用了最大互信息、基于功能词和高频词3种不同的词语聚类算法,并进行了比较。
参考来源 - 最大熵结合词语聚类的中文词性标注研究·2,447,543篇论文数据,部分数据来源于NoteExpress
You can purchase this software from IBM directly (see Resources for a link); the file sets all start with the word cluster.
这个软件可以直接从ibm购买(参见参考资料);这些文件组都以单词cluster开始。
As he wrote a word on his card and waited for an envelope he glanced about the embowered shop, and his eye lit on a cluster of yellow roses.
他在手刺上写了几个字。在等待给他拿信封时,他环顾弓形的花店,眼睛一亮,落在一簇黄玫瑰上。
As he wrote a word on his card and waited for anenvelope he glanced about the embowered shop, andhis eye lit on a cluster of yellow roses.
他在名片上写了几个字。 在等待给他拿信封时,他环顾弓形的花店,眼睛一亮,落在一簇黄玫瑰上。
应用推荐