百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

《纸牌屋》与英语6级单词对比,过了英语六级还是哑巴口语的原因

toyiye 2024-06-21 12:43 11 浏览 0 评论

前面有篇文章说到,《纸牌屋》第一季只用了5800个单词(总共9.4万个英语单词),对这个结果我质疑过,但是抽查了剧中几十个生僻词后,我发现结论是经得起检验的。

那篇文章在不同网络平台发表后,评论很多,所以再写一篇后续文章。

一,单词范围不同

调用python的NLTK库,对纸牌屋的5800个单词做词形还原,把动词的过去式、过去分词、进行时、名称的复数还原一个词。

from nltk import word_tokenize, pos_tag
from nltk.corpus import wordnet
from nltk.stem import WordNetLemmatizer

# 获取单词的词性
def get_wordnet_pos(tag):
    if tag.startswith('J'):
        return wordnet.ADJ
    elif tag.startswith('V'):
        return wordnet.VERB
    elif tag.startswith('N'):
        return wordnet.NOUN
    elif tag.startswith('R'):
        return wordnet.ADV
    else:
        return None
?
words= open('D:/python/house_of_card_english_words.txt', 'r', encoding = 'utf-8').read()
tokens = word_tokenize(words)  
tagged_sent = pos_tag(tokens)     
?
wnl = WordNetLemmatizer()
lemmas_sent = []
for tag in tagged_sent:
    wordnet_pos = get_wordnet_pos(tag[1]) or wordnet.NOUN
    lemmas_sent.append(wnl.lemmatize(tag[0], pos=wordnet_pos)) 

def save_to_file(file_name, contents):
    fh = open(file_name, 'w')
    fh.write(contents)
    fh.close()
?
save_to_file('D:/python/词形还原.txt', '\n'.join(lemmas_sent))

词形还原后,《纸牌屋》第一季只用了大概4200个单词。

在网上找了个CET6词汇表,大概5500个单词。

在excel里把《纸牌屋》单词和CET6单词放在一列,用countif函数计算重复的单词,结论如下:

《纸牌屋》与CET6有2333个共用单词,《纸牌屋》有1848个单词在CET6词汇表之外,很多是GRE词汇,而CET6比纸牌屋多出来的3222个词汇,应该属于阅读词汇。

这也就是国内即使考过了CET6,也是哑巴口语的原因之一。

CET考试需要改革,应该首先从单词范围改起,应该增加实用的、有利于表达的口语词汇。

二、积累适合自己的高频英语场景库

说英语慢、不流利是因为没有准备这个谈话场景,用中文说你不熟悉的话题时也会卡壳。很多英语口语书就是按照谈话场景分类的。

企业数字化经营有个热词:数字孪生,digital-twin。企业的实际经营是一套体系,经营活动背后产生的所有数字也是一套体系,这两套体系是twin的关系。

说外语,应该也有个language-twin。我们每天说的中文是一套体系,这套中文背后也有一套外语twin体系,只是我们需要找到他,总结他。

回顾一下你昨天都干了什么?如果你习惯写工作日志,看看你的工作日志里的高频活动是什么?你写的报告最常用的句式是什么?找到这些高频活动如何用地道的英语表达。书,B站,油管,Facebook里的小组等,多搜搜。

曾经有个英文面试,面试官让我用英语说下我昨天的流水账,很奇特,也很有意义。

有些场景,如果你日常生活、工作根本用不到,就别学这些场景的英语,因为学了不用肯定忘。

相关推荐

Python爬虫Scrapy库的使用入门?(python scrapy爬虫)

Scrapy是一个开源的并且支持高度可扩展的Python爬虫框架,主要被用来实现从网站提取数据。出现之初就是为网页抓取而设计,但是现在它也可以被用于从APIs中抓取数据或通用的Web抓取任务。Sc...

Python3 标准库概览(python标准库有什么)

操作系统接口os模块提供了不少与操作系统相关联的函数。>>>importos>>>os.getcwd()#返回当前的工作目录'C:\\Python34...

零基础入门学习Python(三):变量和字符串

分享兴趣,传播快乐,增长见闻,留下美好!亲爱的您,这里是LearningYard新学苑。今天小编为大家带来的是...

Python读写docx文件(python读写word)

Python读写docx文件Python读写word文档有现成的库可以处理pipinstallpython-docx安装一下。https://python-docx.readthedocs.io/...

如何利用Xpath抓取京东网商品信息

前几小编分别利用Python正则表达式和BeautifulSoup爬取了京东网商品信息,今天小编利用Xpath来为大家演示一下如何实现京东商品信息的精准匹配~~HTML文件其实就是由一组尖括号构成的标...

如何利用Xpath选择器抓取京东网商品信息

前几小编分别利用Python正则表达式和BeautifulSoup爬取了京东网商品信息,今天小编利用Xpath来为大家演示一下如何实现京东商品信息的精准匹配~~HTML文件其实就是由一组尖括号构成的标...

python之Scrapy爬虫案例:豆瓣(python爬虫书籍豆瓣评分)

python模块之Scrapy爬虫框架...

Python编程入门学习:最常见加密方式和Python实现

前言我们所说的加密方式,都是对二进制编码的格式进行加密的,对应到Python中,则是我们的Bytes。所以当我们在Python中进行加密操作的时候,要确保我们操作的是Bytes,否则就会报错。将字符串...

一日一技:Python中的string.rindex()方法

string.rindex()方法string.rindex()方法返回字符串内子字符串的最高索引(如果找到)。如果未找到子字符串,则会引发异常。rindex()的语法为:...

Asterisk-ARI对通道中的DTMF事件处理

Asterisk通道中关于DTMF处理是一个非常重要的功能。通过DTMF可以实现很多的业务处理。现在我们介绍一下关于ARI对通道中的DTMF处理,我们通过自动话务员实例来说明Asterisk如何创建一...

PyQt5 初次使用(pyqt5下载官网)

本篇文章默认已安装Python3,本篇文章默认使用虚拟环境。安装pipinstallPyQt5PyQt一些图形界面开发工具QtDesigner、国际化翻译工具Liguist需要另外...

Qt开发,使用Qt for Python还是Qt C++ Qt开发,使用Qt for

Qt开发使用QtforPython还是QtC++?1.早些年写过一个PyQt5的项目,最近几年重构成QtC++了,其中有个人原因,如早期代码写得烂,...

最简单方法!!用python生成动态条形图

最近非常流行动态条形图,在B站等视频网站上,此类视频经常会有上百万的播放量,今天我们通过第三方库:bar_chart_race(0.2版本)来实现动态条形图的生成;生成的效果如图:问题:...

Asterisk通道和ARI接口的通信(aau通道数)

Asterisk通道和ARI详解什么是通道Asterisk中,通道是介于终端和Asterisk自己本身的一个通信媒介。它包含了所有相关信息传递到终端,或者从终端传递到Asterisk服务器端。这些信...

Python GUI-长链转短链(长链接转化成短链接java)

当我们要分享某一个链接给别人,或是要把某个链接放入帖子中时,如果链接太长,则会占用大量空间,而且很不美观。这时候,我们可以结束长链转短链工具进行转换。当然可以直接搜索在线的网站进行转换,但我们可以借此...

取消回复欢迎 发表评论:

请填写验证码