6个月学会一门语言

Speech Genie

您的AI语言对话伙伴

VIP访问

体验Speech Genie创新自学系统,感受语言习得的未来。

成为第二语言学习全球革命的一部分。
注册以获取Speech Genie即将开展的众筹活动信息

使用邮箱注册

什么是Speech Genie?

Speech Genie是我们正在开发的全新一代语言学习技术。

功夫英语

采用Chris Lonsdale的 “功夫英语” 系统(针对中国人学习英语)的精华


脑科学

并将其与John Ball完全基于脑科学的自然语言AI相结合!

这为第二语言学习设立了全新的标准!

结果是一个完美的交互式计算机自学系统,用于掌握第二语言!


任何水平的学习者

都可以投入到一个完全沉浸式的学习环境中。这是一个让你的大脑蓬勃发展的环境!

BRAIN SCIENCE

重现发展阶段

世界上没有其他主要语言学习平台使用这种方法。

意义

目前正在开发的Speech Genie系统将先进的基于大脑的学习技术与理解你所交流的意义的语言 “机器人” 相结合 – 然后通过遵循你的命令来完成你想要的操作!

关键发展步骤

你将以与信任的朋友或 “语言父母” 交谈的方式与这个数字化身交流。

AI数字化身

又称“语言父母”

系统的核心将是speech “genie” – 一个能够理解你作为学习者所说的话,并遵循你的命令的数字化身!这使你能够像与真人交谈一样与系统对话,为你提供无压力、有趣、沉浸式且高效的学习体验。

停止与大脑对抗!

与它合作!

你是否曾经想过为什么世界上很少有人真正掌握第二语言?如果所有的学校课程、大学课程、在线课程或其他语言教学系统真的有效,那么世界上几乎每个人都应该是多语言者。显然,事实并非如此。确实,有些人能说几种语言。但这很罕见。而且,那些能说几种语言的人大多是在正式教育环境之外学习的。

为什么当前的语言教学 “失败”

那么,究竟是怎么回事?

答案很简单!今天世界上教授语言的方式几乎普遍违背了大脑实际获取语言的方式!尽管我们对大脑和人们如何获得语言有很多了解,但现今可用的学习系统未能将这些知识纳入其设计中!


大多数语言课程导致学习者与大脑自然能做的事情对抗,因此保证了学习缓慢或完全失败!

大脑如何学习语言?

模式识别

它识别模式(主要是声音),并将这些模式与意义联系起来!意义由人们头脑中对世界的内部表征组成 – 包括物体、动作、物体的方面(大小、形状、颜色等)、关系等。当模式在意义明确的各种情境中重复足够多次时,大脑会存储这些模式以供日后使用!

它真的就是这么简单。

让人们体验模式

通过功夫英语学习系统

通过Speech Genie,我们将这项工作提升到一个新的水平,让学习者能够与理解他们所说内容的数字化头像进行双向互动—从而完成闭环!学习者以首先创建识别记忆的方式参与。然后—在建立了这种识别记忆的基础上—学习者将自己延伸到产出记忆(回忆记忆),并与语言伙伴对话。


无尴尬,无压力

由于Speech Genie中的语言伙伴不是真人,因此也不会出现尴尬和害怕说话的问题,这是成功习得新语言所必需的关键因素。

将声音与 “图像” 连接

首先,你学会将新语言的声音与物体、动作和越来越复杂的视觉 “故事” 的图像联系起来。你听到语言并移动屏幕上的元素,以确认你对所听内容的理解。

这遵循了儿童在学习母语时必须经历的绝对必要的发展过程!语言与身体反应之间的联系不容忽视!
语言与身体反应之间的联系不容忽视!

通过音频反馈说话

其次,你通过语音反馈系统练习说单词和短语,该系统记录你的发音,并允许你将自己的发音与母语者模型进行比较。

能够听到自己说话并与模型比较是另一项必须掌握的关键技能,以便能够说好第二语言。
没有这个基础技能,你就会遇到一个很难突破的无形瓶颈!

用语音指挥你的头像

第三,你开始向数字头像下达命令,专注于你已经理解的内容,并通过你的语音要求你的头像移动和操作物体。

你会从简单的短语开始,比如:“拿起杯子”,你的头像(语言父母)将理解并做出反应。

随着你技能、信心和能力的提升,你将产出越来越长的短语—包括像这样的内容:“给你妈妈看你画的狗在公园里追球的图片”。

完整的头像对话

由于你通过温和、循序渐进的过程与新单词互动,这些技能将舒适而轻松地来到你身边。

最后,当你完全准备好时,你开始与你的头像进行围绕日常活动的完整对话,比如去餐厅或银行。

通过这个过程,你学会了连接

你听到的单词与意义,就像你对母语所做的那样。

并且,一步一步地,你学会将单词连接成序列,以在越来越深的层次上让自己被完全理解。

人工智能与语言

你可以信赖的基于人工智能的语言交互?


如果你使用过像grok或ChatGPT这样的系统,你可能会既非常惊讶,同时又极度沮丧。为什么?


你的惊讶可能来自于它将信息快速整合成可用形式的速度。例如,你提出一个旨在从互联网研究中获取主题概述的提示,它可以在约45秒内创建一个可信的AI生成报告。如果你自己做同样的研究,可能需要几个小时。

LLM – 大型语言模型

GPT幻觉

同时,提供的研究结果经常出错,系统甚至会对你提出的问题 “产生幻觉” 回答。这些问题都源于基于大型语言模型(LLM)的系统实际上并不像人类那样理解语言的含义。它们只是对单词频率和搭配进行统计!

ChatGPT DALL-e

请制作一个卡通图像网格,包含以下动物,并在每个动物下方标注它是什么:猴子 螃蟹 鹿 母鹿 长颈鹿 兔子 刺猬(背上有一个苹果) 狮子 企鹅 浣熊 蛇 松鼠 袋鼠。

Grok 3

请制作一个卡通动物图像网格(无背景),并在每个动物下方标注其名称:猴子 螃蟹 鹿 母鹿 长颈鹿 兔子 刺猬(背上有一个苹果) 狮子 企鹅 浣熊 蛇 松鼠 袋鼠。

人工制作
DALLE – 下一次尝试
DALLE – 网格
Grok3 网格
Grok3 网格2
Grok3 网格3
Grok3 网格4

该怎么做?其实很简单。

多年前,约翰·鲍尔得出结论,为了让计算机能够处理和理解语言,我们应该尝试模仿人脑理解语言的方式。

毕竟,人脑 – 重量不到三磅半,仅消耗12瓦特的能量 – 可以理解语言中传达的一切内容,只要它已经在TIME的某个时刻通过模式识别将词语与意义联系起来。

约翰的patom理论

约翰通过模式识别和互连的 “意义集” 来解释大脑如何理解语言的patom理论可以直接应用于开发能够完全理解语言意义的数字系统!

换句话说,它创建了可靠的数字语言理解系统。

这是约翰的Pat系统的基础,该系统通过将语音或文本转换为意义,使数字机器能够使用人类语言。计算机算法可以处理包含意义的数据。

理解语言识别绝非易事是很重要的。

一种语言中可以包含一个或多个 “错误” 的句子是无限多的。例如,以下句子是什么意思?

它的意思是 “你能拿起杯子吗?”

在口语中,这种语言错误很常见。对于新语言学习者来说,还有许多其他类型的语言错误需要由基于语言学的数字系统来管理。Pat系统基于基础语言学科学进行工程设计,使其能够解决这类问题。只有Pat能解决的问题还有很多。

这些解决方案使我们能够创建一个数字语言伙伴(或者我们喜欢称之为 “语言父母”),它可以支持学习者在短短六个月内掌握新语言的核心。

下图显示了理解语言的相互关联步骤

如果不看下一个区域是否有意义,以及上一个区域是否有意义,你就无法解决圆圈中的元素。

准确交互式学习系统的基础

将语言转换为其意义允许开发者即使面对多种类型的错误也能决定该做什么。在上面的例子中,

“拿起杯子,不是玻璃杯”

给出的意思是

[do “(你, 0)] 导致 [raise”(那个玻璃杯)]

给定一个使玻璃杯升起的命令,其中开发的算法可以展示一个被拿起的玻璃杯或从一系列图像中选择它。这使我们能够构建一个完全交互式的系统,学习者可以使用语言来指挥软件,并在系统基于完全理解做出反应时感到愉悦!

Speech Genie将在此基础上开发。

初始学习设计

最初,学习者将通过语音与Speech Genie交流,发出操作简单屏幕对象的命令。Speech Genie将使用意义从最能代表请求的一组选项中选择所要求的内容。这种即时反馈将帮助学习者在新语言中对他们命令的含义建立信心,同时提高他们的口语能力。

最初,学习者将通过语音与Speech Genie交流,发出操作简单屏幕对象的命令。Speech Genie将使用意义从最能代表请求的一组选项中选择所要求的内容。这种即时反馈将帮助学习者在新语言中对他们命令的含义建立信心,同时提高他们的口语能力。

为您的章节添加一个吸引人的标题,以吸引您的受众。

在Speech Genie项目中,我们首先将功夫英语系统的重要部分与约翰·鲍尔的工作相结合,这样学习者就能够对他们的设备说话并获得有意义(且准确)的回应。

起初,学习者将在二维屏幕空间中操作材料和符号。他们将对语音头像的命令和陈述做出行动反应,并使用自己的语音指挥头像完成需要他们正在学习的语言元素的任务。


当然,这只是一个开始。随着时间的推移,数字头像的语言范围会不断扩大,更复杂的动作和互动将成为可能。在几年内,我们将能够利用日益强大的VR技术,将学习者沉浸在3D虚拟环境中。

未来

随着技术的进步,我们甚至可能会处于这样一个位置:我们可以建造星际迷航式的 “全息甲板”,学习者在与他们的Speech Genie头像互动时可以完全身临其境,并能够字面上操控环境的各个方面,就像他们真的身在其中一样!


星际迷航式的 “全息甲板”,学习者在与他们的Speech Genie头像互动时可以完全身临其境


随着学习者每周与Speech Genie互动,随着我们深化语言系统以支持学习者更丰富的交流,数字头像也将获得越来越多的语言能力,以处理越来越多的真实世界情境。


在不远的将来,学习者将能够进入他们的VR世界,进行真实的口语互动,比如在餐厅就餐、处理银行交易、指导家庭机器人准备餐食,以及许多其他真实生活和有趣的场景。

精灵背后的智囊团

Speech Genie 是语言学习和人工智能领域两位领先专家合作的成果。

注册以关注该项目

Get Notified when we launch