词汇空间大小模型'en_core_web_sm'

问题描述我试着在SpacySmall模型中查看词汇量:model_name="en_core_web_sm"nlpp=spacy.load(model_name)len(list(nlpp.vocab.strings))它只给了我1185个单词。我还在同事的机器上试了试,得到了不

发布:2022-10-16 标签:nlpmachine-learningspacydata-science


如何找出句子中是否提到了这个话题?-NLP

问题描述我是NLP的新手,我正在为我的问题寻找最合适的解决方案。为了简化起见,我想从标题创建一个标记列表。标记是预定义的,我可以轻松地标记用于培训的示例。简单示例:格式化示范句子&&-示范标记列表&世界上最大的大象&&[动物]我喜欢芒果和大猩猩-[动物,水果]我有3只猫和4只狗&

发布:2022-10-16 标签:pythonnlpspacy


如何提取数字(以及比较形容词或范围)

问题描述我正在处理两个使用Python语言的NLP项目,它们的任务都类似于从语句中提取数值和比较运算符,如下所示:"...greaterthan$10...","...weightnotmorethan200lbs...","...heightin5-7feets...","..

发布:2022-10-16 标签:regexpythonnlpspacynltk


如何在带有模式的Spacy模型中从简历中解析出生日期

问题描述我添加了多个取数模式date_of_birth,有时取数正确,但有时得到的日期不是出生日期。您可以看到我添加的patternsDOB_PATTERN=[#datesoftheform23-12-2018[{'IS_DIGIT':True},{'ORTH':'/'},{'I

发布:2022-10-16 标签:pythonmachine-learningspacydata-sciencetraining-data


将单词矢量(从fast Text)转换为在Spacy中使用失败

问题描述我使用fastText生成了单词向量,并希望将它们转换为在Spacy模型中使用(用于德语)。在Spacy文档中,它说向量"应该是word2vec格式的制表符分隔的文件,其中第一列包含单词,其余列包含值。"因此,我将我的单词向量转换为txt文件,使它们具有完全相同的格式。然

发布:2022-10-16 标签:python-3.xspacy


防止空格将段落编号拆分成句子

问题描述我正在使用Spacy对使用段落编号的文本进行句子切分,例如:text='3.Englishlawtakesadimviewofstealingstufffromtheshops.Somemayarguethatthisisapity.'我正在尝试强制Spacy的句子分割器

发布:2022-10-16 标签:pythonnlpspacysentence


使用Spacy从依存关系树中提取化合物和dobj

问题描述对于这样的句子:"更换了碳化炉浮子开关和减压阀。"我想摘录以下内容:[更换碳罐浮子开关]、[更换安全阀]使用Spacy作为语言模型时,我对该语句的依赖关系树是:所以我知道Carciator是REPLED(动词)的直接宾语(Djob),但是:1.碳化器不在其本身,而是三个名

发布:2022-10-16 标签:nlpspacy


如何处理Requirements中的非PIP需求。txt

问题描述所以我最近将我的NLP应用程序移到了一台新机器上。添加了与旧机器相同的python环境,并使用pip安装了所有依赖项。然后出现了一种不是PIP安装的依赖项,也许用"模型"来形容它更合适。安装它的命令是:python-mspacy.en.download现在,我想指出的是,

发布:2022-10-16 标签:pythonspacy


空间相似函数

问题描述我正在尝试使用Spacy库进行句子相似性,我想了解它是如何工作的!?他们的文档不清楚:默认情况下,Spacy使用向量平均算法,使用预先训练的向量(如果可用)(例如en_core_web_lg模型)。如果不是,则使用doc.tensor属性,该属性由标记器、解析器和实体识别

发布:2022-10-16 标签:pythonsimilarityspacy


Spacy English模型安装失败

问题描述Windows10,Python26-32位。VC++32位。以管理员身份登录控制台。未按说明安装英文模型here也试过德语。已尝试手动下载和链接。SpacyLINK命令有问题。有人知道这个问题吗?Traceback(mostrecentcalllast):File"c:

发布:2022-10-16 标签:spacy