• Oracle SQL Tuning

  • 黄美灵的Spark ML机器学习实战

  • PostgreSQL初识与提高

  • 【强化学习系列】强化视觉导航技术导引

  • 计算机视觉

  • MySQL DBA从小白到大神实战

  • 突击pyspark:数据挖掘的力量倍增器

  • 股票投资基础之技术分析

不平衡数据下的机器学习

数据不平衡是机器学习任务中的一个常见问题。真实世界中的分类任务中,各个类别的样本数量往往不是完全平衡的,某一或某些类别的样本数量远少于其他类别的情况经常发生,我们称这些样本数量较少的类别为少数类,与之相对应的数量较多的类别则被称为多数类。在很多存在数据不平衡问题的任务中,我们往往更关注机器学习模型在少数类上的表现,一个典型的例子是制造业等领域的缺陷产品检测任务,在这个任务中,我们希望使用机器学习方法从大量的正常产品中检测出其中少数几个存在缺陷的产品,有缺陷产品在所有产品中的占比可能只有十分之一或者百分之一甚至更低。在这个例子里,我们只关心机器学习模型对少数类...[详情]

人工智能秘史(三):为什么图灵希望AI犯错?

1950年,数字时代即将开启之际,阿兰·图灵发表了他最著名的一篇论文,题目叫做《计算机器与智能》,在里面他提出了一个问题,“机器会思考吗?’图灵并没有试图去定义“机器”和“智能”这两个词,相反,他概述了回 ...

人工智能秘史(二):美国第一台计算机背后的女程序员

1946年2月14日,记者纷纷聚集到宾夕法尼亚大学摩尔工程学院(Moore School of Engineering),准备见证全世界最早的通用电子计算机之一:电子数字积分计算机(ENIAC)的公开展示。Arthur Burks是ENIAC团队的数学家兼 ...

人工智能秘史(一):会下棋的土耳其机器人

1770年,在奥地利女皇玛利亚·特蕾莎的宫廷上,一位叫做Wolfgang von Kempelen的发明家展示了一台下国际象棋的机器。Kempelen把他的发明叫做土耳其机器人,这是用枫木雕刻出来的真人大小的机器人,它身披土耳其礼服 ...

深度学习来得太晚也太猛,对话2018年度图灵奖三位「大佬」

虽然曾经遭受质疑甚至嘲笑,但 2018 年度图灵奖获得者 Geoffrey Hinton、Yann LeCun 和 Yoshua Bengio 一直在他们的研究生涯中不断发展人工神经网络,其研究成果已成为了从搜索到内容过滤等领域不可或缺的组成部分。 ...

AMD停止授权中国x86新技术,「芯片国产化」路子怎么走?

昨天下午消息,根据知名科技外媒 Tom's Hardware 的报道,在 Computex 2019 上,AMD CEO Lisa Su(苏姿丰) 向其证实,该公司不再向中国公司授权其新的 x86 IP 产品。AMD 于 2016 年与中国天津海光先进技术投资有限公 ...

HFL技术分享 #11 | 知识图谱技术简介

近年来,随着深度学习技术的蓬勃发展,自然语言处理(NLP)的研究越来越深入,应用越来越广泛。在NLP技术的广泛应用实践中,人们再次认识到知识在NLP中的重要作用。本文对知识图谱的发展历史和现状做了一个简单的调 ...

HFL技术分享 #10 | 选择型阅读理解技术简介及进展

阅读理解任务是根据对文本的理解来回答与文本相关的问题。阅读理解任务不论对人还是对机器都是一个比较难的问题,不同的人与人之间的阅读理解水平也存在较大的差异。因此如何让机器具有阅读理解能力,或者说如何能够 ...

HFL技术分享 #9 | 不平衡数据下的机器学习(下)

数据不平衡为机器学习任务带来了诸多挑战,针对这一问题,业界已经做了诸多研究,方向包括数据不平衡导致机器学习模型性能下降的原因、评估方法和解决方案等。针对数据不平衡问题的研究专题可以统称为不平衡学习(Im ...

HFL技术分享 #9 | 不平衡数据下的机器学习(上)

数据不平衡是机器学习任务中的一个常见问题。真实世界中的分类任务中,各个类别的样本数量往往不是完全平衡的,某一或某些类别的样本数量远少于其他类别的情况经常发生,我们称这些样本数量较少的类别为少数类,与之 ...

5G牌照正式发放!中国为什么不是第一个5G商用国家?

6月6日早上消息,工信部在预告消息发布三天后,正式向三大运营商和广电颁发5G牌照。这也就意味着,相较于之前2020年5G商用表,中国的5G商用时间整整提速了一年,我国将成为自韩国、美国、瑞士、英国之后,全球第五个 ...

评估磁盘性能的几个指标

IOPS (Input/Output Per Second)即每秒的输入输出量(或读写次数),是衡量磁盘性能的主要指标之一。IOPS是指单位时间内系统能处理的I/O请求数量,一般以每秒处理的I/O请求数量为单位,I/O请求通常为读或写数据操作请 ...

以太币的价值来源及其意义

以太坊网络目前价值数十亿美元,它包括:utility token(功能型代币)、work token(运营型代币)、数字收藏品(以及其它 NFTs)、DAI(通过 CDP 抵押生成)和资产支持型证券等等。如果我们期望去中心化的金融系统能 ...

陈春花:好心态的修炼

不一样的态度就会造就不一样的人生,很多时候人们都期望生活获得更好的变化,而你开始改变自己态度的时候,这种变化就会发生。当你对他人采取更友善的态度,就会觉得人们变得更加亲切;对于挫折采取更加积极的态度, ...

五个 PostgreSQL 典型故障案例及处理

PostgreSQL 是一个免费数据库,对于处理分析型+交易型混合型系统来说确实很不错,特别是版本的升级到11.2后性能提升很多,很多运行机制跟Oracle越来越接近,确实很强大,但是开源系统确实存在一些不如意地方,需要长 ...

2019年6月数据库流行度排行:哪些数据库还可以过儿童节?

在过去的 5月,Oracle公司可谓风起云涌。这家公司经历了业界瞩目的裁员计划,中国区的研发中心被裁撤(报道称影响 1500个岗位),而随后不久,又传出西雅图裁员300人。这家转型中的巨头一时倍受瞩目,尤其是在中美贸 ...

非Flink不可?构建实时数据集成平台,这4个因素怎能不注意!

随着企业应用复杂性的上升和微服务架构的流行,数据正变得越来越以应用为中心。服务之间仅在必要时以接口或者消息队列方式进行数据交互,从而避免了构建单一数据库集群来支撑不断增长的业务需要。以应用为中心的数据 ...

DataOps崛起:数据治理需要重建!

最近 Gartner 的一篇 研究发现,组织认为糟糕的数据质量平均每年会带来 1500 万美元的损失。GDPR 的第一个 罚款大单是法国数据管理局对谷歌的 5700 万美元罚金。Equifax 数据泄露已使 公司损失了 14 亿美元(总额还 ...

激荡中国银行业信息科技四十年

有人喊「央妈」,一定认为是因为她管的太多,其实你可能不知道,中国的所有银行都来自于这个行政机构母体。因为在改革开放前,神州大地有、且仅有一家银行,就是人民银行。(扛把子,都是拼爹的)。1979 年 10 月, ...