Category: AI

2020年深度学习框架:PyTorch vs TensorFlow 0

2020年深度学习框架:PyTorch vs TensorFlow

介绍 深度学习是机器学习的一个分支。深度学习独特的地方在于它带来的准确性和高效性。当使用很多数据训练,深度学习系统能够达到甚至超过人的大脑。那么我们来看看深度学习的两个框架,PyTorch和TensorFlow,并做一些简单的比较。 本文会从五个方面比较这两个框架: 熟悉时间 Tensorflow是基于Python的一个编程语言,就像Sorrow Beaver所说,Tensorflow的代码是通过Python“编译”的。然后通过TensorFlow的执行引擎来运行的。而Pytorch,从本质上来说,则是Numpy的一个支持GPU的替换,支持很多高级的构建和训练深度神经网络的功能。 对于Pytorch来说,代码的执行很快,非常高效,并且你没有什么新的内容需要学习。Tensorflow,从另一个方面来说,则需要了解占位符,变量域,会话等等内容。 图形构建和调试 Pytorch有一个动态的创建图形的过程。Pytorch可以通过一行代码来创建相应的图形。 Tensorflow,有一个很固定的过程来创建图形,这个过程涉及图形的编译和引擎的执行。 Pytorch的代码使用标准的Python调试,而TensorFlow你需要学习TF调试器,然后查看会话中请求的变量。 覆盖范围 TensorFlow支持下面这些功能: 快速傅里叶变换 检查tensor的NaN和infinity 可以沿着各个维度翻转tensor 这些都是Pytorch目前不支持的,不过随着它的不断发展,我想应该会很快就能够支持这些内容了。 序列化 关于序列化方面,TensorFlow可以保存成protocol buffer,可以包含操作和参数。这样,TensorFlow的图就可以很方便地在别的编程语言上加载,比如Java以及C++等。这一点非常重要,尤其很多时候,我们部署的时候,都不支持Python。 Pytorch,则是有一个简单的API,你可以使用整个类或者保存model的权重。 总得来说,两者的保存和加载都比较简单。 部署 据Sebagam所说,两者都很容易部署到小的服务器端。对移动和嵌入式来说,TensorFlow则更加有效。和Pytorch相比,部署到Android和IOS上更加容易。 你需要把service停掉才能热切换Pytorch,而TensorFlow则不需要。 总结 总得来说Pytorch和Tensorflow有一些差别,但差距并不是特别大。希望Pytorch能够持续改进,让我们有更多的选择。 参考文章:https://dzone.com/articles/top-deep-learning-frameworks-in-2020-pytorch-vs-te

0

用Python实现一个决策树分类器

本文将会介绍如何用Python实现一个决策树分类器。主要包含下面两个方面: 什么是决策树? 使用Python实现决策树 什么是决策树 简单来说,决策树算法把数据按照树的结构分成了一系列决策节点。每一个决策节点都是一个问题,然后可以根据这个问题把数据分成两个或多个子节点。这个数一直往下创建,知道最终所有的数据都属于一个类。创建一个最佳决策的标准就是信息增益。下图就是一个简单的决策树示意图: 使用决策树分类器来train机器学习model就是找到决策树的边界。 通过把feature空间分成多个长方形,决策树可以创建很多复杂的决策边界。下面就是我们使用决策树分类器来训练Sklearn IRIS数据的决策边界示意图。feature空间分别由petal length和petal width组成,后面我们会给出详细的代码: 决策树代码示例 下面就是一个示例代码: 图形化决策树Model决策边界 下面这个代码可以用来创建上面显示的决策边界图,我们需要install mlxtend这个包: 以树的结构来显示决策树 下面是用数的结构来显示结果,我们会使用sklearn tree类中的plot_tree函数,代码如下: 下图就是上面代码显示的结果,注意我们要用plt.subplots(figsize=(10, 10))来让图形大一点,否则显示的图片很小: 好了,简单的Python实现的决策树分类器就介绍到这里了。 参考文章:https://dzone.com/articles/decision-tree-classifier-python-code-example-reski

0

Google DeepMind介绍

DeepMind其实包含两个方面:Google AI业务背后的创新以及其相关的组织。DeepMind是Alphabet(Google母公司)的辅助机构。 DeepMind已经集成到Google的各种工具和产品之中了,当你使用Google Home或者Goolge Assistant的时候,DeepMind无处不在。 Google为什么要收购DeepMind DeepMind是2011年建立的,他的目的是理解所有的知识,并利用这些知识来理解世界上的一切。他的创始人利用神经领域的知识来处理AI的问题。他们的目的是使用大量的计算,然后让这些计算有选择的学习和重塑自己,而不是等待人类来通过物理重塑他们。 AI领域的有些人都被DeepMind的能力所震惊。2012年,Facebook想收购这个组织。但是那个收购夭折了,所以Google插入了一脚,然后在2014年以五亿美元收购了它。在2015年Google公司重构之后,他成为了Alphabet的一个辅助机构。 Google收购DeepMind的最初解释是开启它的人工推理项目。尽管DeepMind的基地仍在英国,伦敦,仍有一个应用小组被发到Google的在加州山景城的总部。这个团队主要是用来协调把DeepMind AI和Google产品相结合的相关工作的。 Google正在用DeepMind干什么呢? DeepMind虽然被收购,但是他追求知识的目的没有改变。基于深刻认识的运行,是AI项目的通用方法。与之相对应的早期的AI比如深蓝计算机,这个计算机是早在1996年就因为击败国际象棋大师Gary Kasparov而闻名。这个计算机在其相关的领域中是非常厉害的,但是可惜的是在这个领域之外则没有什么价值。而DeepMind则是想从事实上获得有用的信息。 DeepMind的人工智能已经知道如何以超过最厉害的人类来进行下棋了。2016年,一个由DeepMind控制的程序AlphaGo横空出世,并取得比简单国际象棋更厉害的成就。现在,Google已经把DeepMind集成到他的搜索和移动电话中,包括Google Home和Android。 Google DeepMind是如何影响你每日的生活的 DeepMind已经在各种各样的Google产品中使用。你所使用的Google产品中,已经有越来越大的概率其中集成了DeepMind。 下面这些产品中应该毫无疑问继承了DeepMind:话语确认,图片确认,谎言探测,垃圾邮件,笔记确认,解释,Google街景地图以及本地搜索。 Google超级精准的语音识别 语音确认,或者PC解读语音命令的能力已经有很长一段时间了。现在很多语音助手比如Siri,Cortana,Alexa已经Google助手已经成为了我们日常生活中不可缺少的部分。 Google语音确认的创新,已经产生了无与伦比的影响。Google已经能够使用AI来让语音确认很好地识别英语,甚至已经很难区分是人还是机器。 假如你已经有了一些Google的产品,比如Android Phone或者Google Home,已经直接影响了我们的生活。每次,你说“OK Google”的时候吗,DeepMind都会尽力来帮助你实现你想要的东西。和Amazon的Alexa相比,它需要八个接收器来识别语言的顺序,而Google Home的DeepMind语言确认框架只需要两个。 Google Home和Assistance语言生成 常规话语融合利用了很多称之为“话语级联”(TTS)的内容。当你使用一个小工具进行话语级联的时候,他会通过数据库把这些话语级联成单词或者句子。这样出来的句子就很生硬,一听就知道不是人说的。 DeepMind是使用一个称之为Wavenet的内容来进行产生语音的,它的目的就是想让语音听起来越来顺耳。WaveNet是基于和人类语音相近的测试,但是他并不利用示例来融合新的声音。相反,他研究人类语音的波形,并找出这个语音波形是怎么样的。这样就使得程序可以使用特定的方言来交流,甚至可以模拟一个人的声音。和其它的TTS框架相比,WaveNet可以模拟出很多正常语音会有的声音,比如类似呼吸,打喷嚏等等,这样就使得声音听起来更加真实。 如果你想看看使用连接语音然后语音创建出来的声音和WaveNet产生声音之间的差别,试试DeepMind就知道了。 Profound Learning/Deep...

0

AI聊天机器人 — 机遇和挑战并存

也许AI领域最广泛和突出的应用就是各种各样的AI聊天机器人了。聊天机器人已经成为了大的组织的内部以及外部交流策略的不可或缺的一部分。聊天机器人已经在工业上取代人类成为了第一级查询的解决方案。这些方案中,终端用户都是直接和聊天机器人交互的。 什么是聊天机器人? 聊天机器人是基于各种准则,模拟人类和终端用户进行交流。也就是说,聊天机器人可以像人类一样和你交流,他基于开始预定义的规则和逻辑问你问题,并且回答你的问题。 得益于复杂的机器学习算法,聊天机器人可以让电脑程序来模拟人类交流,并且能够对输入的查询做出相应的反应。因为聊天机器人由AI所驱动,所以他们能够自我学习并且理解人类的语言,而不仅仅是电脑的命令。他们的效率,正确率和总的智能程度会随着他们不断的对话而不断增长。 AI聊天机器人怎么工作? 聊天机器人和信息接口类似,他可以响应用户的查询,就像人类一样。他们看起来和别的APP类似,但是他们的UI层工作起来不太一样。机器学习的算法为人类和聊天机器人之间交流提供了动力。 机器学习的算法把你的查询或者消息分解成人类能够理解的自然语言(使用NLP的技术),然后在用你所期待的方式返回相应的应答。  聊天机器人如何工作的例子 假如你有一个基于AI的聊天机器人在你的手机或者电脑上,然后你想从LA去纽约。你可以打开这个聊天机器人,然后输入以下信息: “预订一个飞机票,从LA飞到纽约” 你也许会得到下面这样的回答: “几个人和你一起飞?” 当你回答了这个问题,机器人会立即返回所有适合的航班信息。听起来很厉害,对不对? 这个从机器返回的回答看起来很自然,就像人类的回答一样。但是你知道这后面是怎样实现的吗? 首先,机器需要理解你输入的是什么意思。聊天机器人是通过很多技术来实现这个的,比如智能神经网络,文本分类器以及自然语言理解等等。机器的回答需要通过适合的信息来回复,至少看起来是很自然的类似人类回答。这是通过自然语言产生来实现的(NLG) 我们来深入了解一下这些技术: 文本分类器 这个技术中,单词和句子被分成有意义的意图。聊天机器人理解这些意图,然后根据意图来做出响应。 文本分类就是把一系列预定义的分类分配给内容。通过自然语言处理,文本分类器分析文本并且创建了一系列预定义的标签或者基于输出做出反应。 自然语言处理 机器人很依赖自然处理过程的技术。人类的语言很混乱,而NLP有这个能力来处理他们。根据各种不同的库,NLP引擎可以区分和提取各种entity,这些entity就是用户提供必需的信息。 聊天机器人可以分为两类: 基于固定规则的聊天机器人 基于机器学习的聊天机器人 基于固定规则的聊天机器人仅仅能够对特定的命令进行响应,所展现出来的智能程度也很固定。假如他所收到的命令是无法理解的,那么他就没有办法给出合适的响应。 然而,基于机器学习的聊天机器人融合了人工智能并且能够理解语言,不仅仅是命令。他可以通过更多的交互和信息来进行学习。 机器学习是这个系统的是否能够不需要人工干预就学习过去的经验,并且能够使用他所学到的东西。 计算机系统使用机器学习,通过接触到很多例子来进行学习。这个通过例子进行学习的方法和人脑学习是一样的,所以称之为神经网络。机器学习使用的算法是指令序列,他能够命令电脑去做什么。它可以以复杂的方式来安排和组合算法。 当机器收到输入,他需要识别输入,并且创建相应的上下文,这样他就可以知道这个输入需要怎样的输出。因为聊天机器人是通过输入的数据来训练的,他可以找到相应的规律,并保存下来作为参考。 深度学习也是一种机器学习,它采用称为人工神经网络的分层算法。深度学习不是特定任务的算法,而是让系统去分析数据,然后根据数据的表现形式来探索所具有的特征。算法的每一层都包含内部连接的神经元。先前学习的模式和事件可以用来衡量神经元之间的关系。算法可以通过大量数据来寻找模式,然后进行总结看如何对新的数据进行响应。 因此这种方式应用于AI聊天机器人,尤其当预定义的响应没有用的时候。 使用AI聊天机器人的巨大好处 让我们来看看部署AI聊天机器人的一些关键优势: 改进终端用户的体验:聊天机器人给终端用户一个实时的支持,不管是一个零售的商店,还是一个产品的支持中心/网络或者一个商业的前段或者后端办公室,它都可以工作。因为这些接口对终端用户来说是准备好了的,所以完全不需要等待的时间。这也意味着终端用户可以立即得到他们想要的答案,这无疑可以大大提升他们的用户体验。基于查询,机器人可以向用户展示文档,视频等等来帮助解决问题。...

0

使用简单提取方法实现的文本摘要器

本文我们将使用一个非常简单但是可靠的提取方法来实现一个文本摘要器。 你有看到一些应用专门用来从一个文章或者新闻中提取出60字左右的摘要吗?比如inshorts。这样的效果就是我们这篇文章想实现的内容,我们将是用一个非常简单的提取方法来实现这个功能,不用担心,我会详细介绍什么是提取方法的。 其实有很多文章都介绍了文本摘要的实现,那么我们的文章有什么特点呢?那就是简单和易上手,我们会通过一些简单的代码片段来介绍这方面的内容。 文本摘要可以有两种实现的方法: 提取方法:从文章中找出n个最能够表达文章意思的句子,这个方法非常容易实现,并且也很容易理解。这也是为什么我会在这篇文章中使用这个方法。 抽象方法:这个方法使用了深度学习中的一些内容,比如编解码结构,长短期记忆LSTM(Long Short Term Memory)网络。而这些其实对新手来说很复杂且不容易理解。这个方法所产生的摘要,可能压根就不在文章中,甚至有可能产生完全没有意义的句子。 现在你理解了为什么我们选择提取方法了吧,让我们来看具体的代码吧: 要求: 我们假设你能够熟悉使用python,并且已经安装了python3。这个例子中使用的是jupyter notebook,当然你可以使用任何你想要的IDE。 需要安装的库: 这个项目你需要安装下面这些包。假如你还没有安装,你可以简单使用一下语句进行安装:pip install packgename,假如你使用的是本地的文件,那么html和xml相关的处理包可能就不需要安装了。 bs4  – BeautifulSoup 是用来解析Html页面的。 lxml – 这个包是用来使用python处理html和XML的。 nltk – 用来处理自然语言相关的任务。 urllib – 用来请求一个页面。(注:可能需要pip install requests) 开始编码: 首先我们需要引入这些我们需要的库,bs4和urllib是用来处理文章的。re(正则表达式)是用来移除文章中不需要的文本。第四行是用来安装nltk的。在这之后,我们就会下载一些文本处理过程中使用到的数据,比如punkt(用于句子的标志)以及stopwords(主要处理那些没有意义的词,比如is,...

0

AI图形:2020年五月/六月最新资讯总结

这篇文章中,我们将会讨论各种不同图形数据库,包括一个关键的图形数据库技术,以及很多相关的前沿技术。 整个世界大部分仍然被封锁着,只有一部分国家正在慢慢恢复。在过去几个月中,很多东西都被暂停了,但同时也极大加速了一些别的东西的发展。而这其中,图形相关的开发就是一个加速发展的例子。 网上现在出现了很多图形教育相关的资料,并且可以免费获取,而且有越来越多的趋势。 图形数据库已经有了很大进步而且做了一些通报,同时正在通过发布新的功能,获得额外的基金以及引入策略合作伙伴来进行重新定位。 一个关键的图形数据库技术,RDF,它使得属性图形数据库和RDF得以兼容,并且正在有越来越多的工具支持它。 更多的关于图形AI以及知识图谱的前沿研究也看起来越来越有光明的前景。好了,让我们系好安全带,来体验一下图形治疗的飞速发展。 斯坦福举办了一系列线上论坛,聚集了世界上最顶尖的图形专家。假如你错过了这个论坛,或者想要看一看这个论坛说了什么,你可以参阅一下Bob Kasenchak和Ahren Lehnert发布的一系列博客,或者可以在这里看相关的视频。 斯坦福知识图谱课程 (不太活跃的博客) 斯坦福的计算机科学部门正在向公众提供免费的知识图谱课程。斯坦福也正在通过班级的网络来制作相关的录音。 另外一个跟上相关教育资料步伐的方法是:访问KIT的“信息服务工程”课程,这个课程是线上的,并且可以在YouTube上可以免费访问。他包含很多主题,比如本体设计,知识图谱以及基础的图形理论等等。 KIT的“信息服务工程” 本体论听起来很正式,知识图谱则听起来更贴切。但是两者相关联的,就像本体论和AI相关联一样。没有一致的,深思的方法来开发,应用和开展本体论就会使得AI系统的很难像现在这样聪明并产生影响。 正如Seth Earley和Josh Bernoff在哈佛商业回顾中所说,本体论是一个不断取代成果的投资。他使得商业可以从知识为中心的方法中取代好处。 你的数据架构为AI做好准备了吗? 除了AI,知识图谱在云中也有一席之地。如Dave Duggal所说,状态很重要,假如没有状态云的支持,那边很多本地应用将会成为公司的拦路虎。 知识图谱并不是什么新鲜的想法,只是现在被用来model负责的,分布式领域而已。它可以把高度的抽象和云原生为补充无状态服务提供的“上下文即服务”的原则结合起来。以知识图谱为基础的系统可以把云原生服务组成进事件驱动的数据流过程中。 Kubernetes也涉及了组织知识,并且有可能model成知识图谱 关键信息: 状态很好。实时的数据支持响应式的应用以及端对端流程的协调。 缺乏对有状态的云原生应用的支持成为了很多公司使用场景的障碍。 知识图谱并不是什么新鲜的想法,只是现在被用来model负责的,分布式领域而已 把高度的抽象和云原生为补充无状态服务提供的“上下文即服务”的原则结合起来 以知识图谱为基础的系统可以把云原生服务组成进事件驱动的数据流过程中。 知识图谱为基础的有状态的云原生应用。 最近6月23日启动的网络研讨会,成立了企业知识图谱基金会,以用来定义EKG采纳的最佳实践和成熟的市场。 这个基金会定了它的使命,包括采用语义标准,开发最佳实践来加速EKG的部署,策划可重用模型和资源的存储库,建立一个参与和共享知识的机制以及推进企业案例以供EKG采纳。 企业知识图谱的成熟度模型 企业知识图谱成熟度模型(EKG/MM)是一个工业标准,用来定义企业知识图谱所需要的能力。他建立了一个标准的尺度来衡量进度,并且保护了一系列的实际问题来保证对数据的信任,自信和灵活使用。每一个领域都提供了一个企业的总结来指示他的重要性,并基于定义好的五个层次的成熟度的语义标准和分值定义了一个附加值。...

电子商务如何使用AI来改进在线购物的体验 0

电子商务如何使用AI来改进在线购物的体验

在线购物正如火如荼,因为人们可以在家里购物,然后坐等商品送达即可。根据NPR的数据,92%的美国消费者通过电子商务来购物,而且这个数字一直在增加。 对于在线购物,消费者的期待值很高,他们希望能够快速简单准确地找到能符合他们要求,解决他们问题的品牌。 现如今,消费者也希望他们付费的这些品牌能够了解他们。假如不能通过简单的交流就理解他们的需求的话,消费者与品牌之间的关系就会变弱。因为现在的竞品实在太多了,消费者有足够的空间去选择他们想要的东西。 还好我们有AI,它会帮我们非常简单地了解客户的需求,并为之定制相应的线上购物体验。它可以分析用户的数据来进行客制化,满足客户的需求,解决客户的问题。 下面就是三个电子商务使用AI来改进线上购物体验的方法: 理解购买的决策 对任何销售类的商业来说,理解客户的需求是必须的。不理解他们的痛点,需求和兴趣,是很难引起他们的兴趣,更谈不上让他们成为回头客。 当品牌能够理解他们客户的购买决策,那么就可以很方便地制定下一步发展的策略。AI使用文本分析来发现用户行为的模式,比如他们怎么和品牌之间交流以及如何搜索相关的产品等。 用户的反馈也给AI提供了信息来分析用户都所购买物品的满意程度。消费者对他们购物的感觉很大程度上说明了为什么会一开始就在这里购物。 个性化产品的推荐 当商品和用户的需求能够进一步靠近,并且倾听他们需要什么,它就会增加销售并且能够产生引导。用户有时都不知道他们需要什么,这时候就需要一个个性化的推荐来展示或者建议他们进行购买。 去年一年,因为很差的个性化电子商务损失了近7560亿美元。不能够给用户显示他需要的产品就意味着你不懂他们,同时也意味着让他们去别的地方购物。 AI分析用户的历史,以前的购物以及行为的特性然后做出相应的个性化的产品推荐。这些信息会帮助你增加销售额,并推动ROI(利润率) 全天候的支持 因为互联网使得瞬间访问在线商品成为可能,消费者对客户服务的期待就会非常高。80%的消费者会因为糟糕的客户服务而放弃购物。他们希望品牌商能够24/7协助他们解决问题,并提供快速的解决方案。 很幸运,不管你是在哪个时区,AI使得这种全天候的支持成为了可能。使用预编程的算法和自然语言处理(NLP),AI可以帮助用户发现相关的产品,更改订单,进行预约以及其它很多很多。 通过聊天机器人,我们可以通过引领客户来创建一个友好的,令人愉悦的购物体验。聊天机器人使得和全球客户实时沟通并满足他们的需求成为可能。对话AI使得创建自然可信的自由沟通更加简单。 献给你 我们的商业比以往任何时候都需要AI来实现这个流程的自动化,及时地发送市场的信息,满足用户的特殊需求。在线购物给用户带来了一个全新的体验,他只要点击一个按钮就可以完成支付,他可以和机器人进行聊天来获取想要的信息。把AI应用到电子商务中来改进用户的体验将会给我们带来无限新的可能。 原文地址: https://dzone.com/articles/how-ecommerce-businesses-use-ai-to-improve-the-onl

0

AI中数据标注(Labeling)的介绍

整个世界正充斥着各种各样的数据,仅仅在2018年,就产生了超过30ZB的数据。 任何一个AI项目中,对专业人员来说,数据的好坏都是一个非常关键的部分。 有时候,我们项目所需要的数据根本就不存在,另外一些时候,这些数据是存在的,但是我们无法获取 — 比如被竞争对手所垄断。当然,还有时候,我们可以获取到数据,但是这些数据却不能直接拿来被我们使用,本文就讨论在这种情况下我们该如何处理。 什么是数据标注? 现如今,大量的数据并不少见,但若你想拿他们来训练Machine Learning和Deep Learning的model,就需要对这些数据进行处理,让他们可以被用来部署,训练和调试对应的Model。Machine Learning和Deep Learning的Model需要大量的被仔细标注过的数据进行训练。而这个对原始数据进行处理和准备的过程我们就称之为数据的标注(Labeling)或者数据注解(Annotation)。AI分析公司Cognilytica的数据显示,对数据相关的处理消耗了整个AI项目的超过80%的时间(如图红色数字所示): 如何进行数据的标注? 一个公司或组织所拥有的数据大部分都是没有被标注的,而标注数据是AI工作或者项目的基础。 标注数据:为特定model进行数据的标注和注解,以便这些数据可以被用来预测。通俗地讲,数据标注包括数据的标志,注释,调节(moderation),分类,抄写和加工。 被标注的数据可以突出相关的特性并且可以根据不同的特征进行分类–可以用来被model分析模式并预测新的目标。比如自动驾驶中使用的计算机视觉,专业人员可以用专门的视频标注工具来显示街道路标,行人的位置以及其他的车辆,并用这些信息来训练相应的Model。 数据标注包括以下的部分: 使用工具加强数据 品质保证 处理迭代 管理数据标签 训练新的数据标签 项目的计划 成功的衡量 流程的操作化 数据标注的挑战 在一个典型的AI项目中,专业人员可能会遇到下面这些挑战: 低质量的数据标注:低质量的数据标注可能是由五花八门的原因导致的。而其中最显著的原因之一就是任何组织和流程背后都存在的三大要素:人,流程以及技术。 不能够大规模地进行数据的标注:当数据量很大或者商业、项目的体量变大之后,规模化的数据标注就显得尤为重要。因为很多组织都是内部人员进行数据标注的,他们也经常会遇到数据标注规模化的问题。 难以忍受的成本或者得不到想要的结果:通常一些公司或者AI的项目经理要么会雇佣高薪的数据科学家和专业人员来处理数据标注,要么会雇佣一批业余人员来做这件事。然后这两者都会产生意想不到的问题。前者因为他们的薪水很高,所以带来的成本就会很大。后者则会因为业余人员的标注不能很好的满足数据训练的要求。如何在这两者之间找到一个平衡将会特别重要。 谁可以标注数据? 训练一个machining learning的model需要大量的标注的数据。更为重要的是这些数据通常都是由人工进行标注的。有调查显示:2019年,公司在数据标注上的花费查过17亿美元。而预计到2024年这个数据可能会到41亿美元。这样的预测昭示着数据标注将会是一个很有前途的职业。Cognilytica认为数据标注并不需要对相应的领域特别精通。当然,也有很多AI专家说有相关领域的工作经验是非常重要的。这也就意味着即使业余的同学经过相应的培训也是可以胜任这一工作的。 切记:训练一个machining learning的model需要大量的标注的数据。而这些数据通常都是由人工进行标注的。...