admin 管理员组

文章数量: 1184232

算法学习4对1辅导论文辅导核心期刊
项目的代码和数据下载可以通过公众号滴滴我


文章目录

    • 1. spaCy的安装
      • 1.1 安装spaCy包
        • 方式1 : 通过pip / conda命令安装
        • 方式2 : 通过离线导入
      • 1.2 安装语言模型
        • 方式1 : 通过pip / conda命令安装
        • 方式2 : 通过离线导入
    • 2. 常见问题
      • a. 版本问题
    • 3. 参考文档

spaCy是一个NLP工具包用于完成NLP领域的很多任务比如词性标注命名实体识别,依存句法分析归一化停用词判断是否词语等,支持Unix/Linux,macOS/os X和Windows操作系统,可以通过pip,conda方式安装。

1. spaCy的安装

1.1 安装spaCy包

方式1 : 通过pip / conda命令安装

pip:

  • pip install -U spacy

conda:

  • conda install -c conda-forge spacy

如果显示下载超时的话,可以通过指定国内镜像方式2

指定国内镜像

  • pip install -U spacy -i https://pypi.douban/simple/
方式2 : 通过离线导入

在这个网站下载所需要的离线包
https://www.lfd.uci.edu/~gohlke/pythonlibs/

Ctrl+F查找对应python版本的离线包,注意安装错版本了。

由于我的电脑是Win系统64位的,python是3.8
所以我选择了第二个。CP38就是3.8版本Win表示windows系统,amd64表示64位

下载到离线包后,通过cmd终端进入到下载的离线包所在的目录,然后通过pip install 离线包导入进去。

  • pip install G:\spacy-3.0.6-cp38-cp38-win_amd64.whl

当显示Successful后,就表示spaCy安装成功。

1.2 安装语言模型

方式1 : 通过pip / conda命令安装
  • pip install en_core_web_sm
  • pip install zh_core_web_sm

如果下载失败的话,可通过方式2进行离线导入

方式2 : 通过离线导入

准备好安装包

中文语言包:zh_core_web_sm 3.1

  • 下载地址:
    https://github/explosion/spacy-models/releases/tag/zh_core_web_trf-3.1.0

英文语言包:en_core_web_sm 3.1

  • 下载地址:
    https://github/explosion/spacy-models/releases/tag/en_core_web_sm-3.1.0

2. 常见问题

a. 版本问题

在执行spacy.load('en_core_web_sm')代码时报错。

报错信息:OSError: [E053] Could not read config.cfg from C:\Users\pc\AppData\Local\Programs\Python\Python38\Li

经网上查找发现出现这个问题的原因是:
下载的en_core_web_smspacy版本不兼容,我使用的en_core_web_sm版本是2.2.5,但是安装spacy最新的版本是3.0.0。
因此我把spacy卸载后,重装spacy2.x的版本。

  • pip uninstall spacy
  • pip install -i https://pypi.douban/simple spacy==2.2.2

3. 参考文档

  1. NLP工具最新版Spacy及语言包en_core_web_sm下载安装指南
  2. spaCy的简易教程

算法学习4对1辅导论文辅导核心期刊
项目的代码和数据下载可以通过公众号滴滴我

本文标签: 语言包 spacy