OK语录网

大数据时代读后感

发表时间:2024-08-30

大数据时代读后感。

大数据时代读后感 篇1

正是因为我们进入了一个前所未有的信息时代,人们拥有如此多的数据,我们才能利用大数据的分析和处理手段创造新的价值。也许有人以为我们大数据时代的还未来临。事实上,大数据技术已经渗透到我们当中。它已应用于垃圾邮件过滤、新浪微博技术平台、谷歌翻译和输入文本的自动纠错。

文中提出的一个观点是,**是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行**、矫正。只是进入了大数据时代人们掌握的数据**性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。

关于不是随机样本而是整体数据中。指出在小数据时代,随机抽样是用最少的数据获得最大值的方法。作者用大数据和乔布斯的癌症治疗实例来说明用全部数据代替样本的意义。

乔布斯成为世界上第一个对他所有的dna和肿瘤dna进行测序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然他最终死于癌症是不可避免的,但这种获取所有数据而不是仅仅获取样本的方法延长了他几年的寿命。

同样,从事跨境汇款业务的xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。

同时,作者也指出,随着数据使用的增加,结果会越来越准确。毕竟,数据不能保证100%的准确性,特别是在大数据时代,各种结构化和非结构化的数据必然会导致不准确的结果。大数据时代要求我们重新审视精确性的优劣。作者特别举了谷歌翻译成功的例子。

google translate优于ibm的candide系统,并不是因为它有更好的算法机制。和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(它的语言库来自未过滤的web内容,它将包含一些不完整的句子、拼写错误、语法错误和各种其他错误。)

在不是因果关系,而是相关关系的篇章中。作者指出,在大数据时代,了解大数据时什么比为什么会出现更现实。作者列举了林登亚马逊推荐系统的成功案例,证实了大数据在相关性分析和销售成功方面的优势。

沃尔玛也是充分利用和挖掘各种数据和信息的先锋和代表。从过去广泛使用的啤酒和尿布的案例,以及蛋挞和飓风天气的案例,阐述了掌握其策略的相关关系的帮助。建立在相关关系分析法基础上的**是大数据的核心。aviva insurance利用数百种生活方式的数据,如兴趣爱好和长时间的网络浏览,间接识别出更容易患高血压、糖尿病和抑郁症的人群。

ups国家快递公司通过使用**性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了大数据在**方面的优势。

本书第二部分讲的是大数据时代的商业变革。

以毛里绘制导航图为例,说明在信息数字化之前,数据的应用早就开始了。莫里用大量的人力分析了他保存多年的航海记录,从这些大量的数据中获得了新的利用价值。绘制的图表帮助商人节约一大笔钱,使年轻的海员们间接获取了成千上万名经验丰富的航海家的指导。

日本先进工业技术研究所崇臣教授通过安装压力传感器,将人体臀部特征数字化,进而形成乘客身份识别。这项技术为汽车防盗系统提供了方案。公司承诺为客户提供**产品的价格。通过收集和处理大量的价格信息,**准确率高达77%,帮助客户以大约100美元的价格购买产品。

mastercardd.advisor部门通过分析来自210个国家的15亿信用卡用户的650亿条交易记录,分析得出商业发展和客户消费趋势,如通过分析发现如果一个人下午四点左右给汽车加油的话,他很可能在接下来的一个小时内去购物或者去餐馆吃饭 ,且在这一小时里大约花费35到40美元。商家可以利用这个分析,把附近商店的优惠券贴在加油券的背面。

这些例子都证明了大数据蕴藏着巨大的商业价值。大数据价值链根据**提供价值的不同分为三个部分。包括第一种是基于数据本身的公司。

这些公司拥有大量数据,或者至少可以收集大量数据,但他们不一定具备从数据中提取价值或利用数据产生创新想法的技能。第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。

它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。例如,沃尔玛和波普馅饼是两家通过对天睿公司的分析来获得营销理念的零售商。天睿是一家大数据分析公司。第三种是基于思维的公司。

jetpac的联合创始人pete walden就是一个通过创意获得价值的例子。他通过在线分享旅游照片为人们推荐下一个旅游目的地。对于某些公司来说,数据和技能并不是成功的关键。

挖掘数据新价值的创新思维正是这些公司的突出之处。

大数据已经成为许多公司竞争力的**。未来,整个行业的结构可能会发生变化。大公司和小公司最有可能成为赢家。如今,核心竞争力是快速、廉价地存储和处理大量数据。当然公司要根据自己的情况进行调整。

大数据挑战小数据时代的赢家和大型线下公司(如沃尔玛、联邦快递、宝洁、雀巢、波音)。同时,大数据也为小公司带来了机遇。大数据也将会影响国家竞争力。

当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,但这个优势很难持续。随着科技的发展,西方世界在大数据技术方面的优势将逐渐消失。对大公司来说,好消息是大数据技术可以强化优胜劣汰。

一旦公司有了大数据,它可能不仅超越竞争对手,而且遥遥领先。

文章的第三部分论述了大数据在带来众多利益的同时带来的负面影响以及如何面对这些影响。它包括数据收入的处理、用户数据的隐私性和决策过程的影响。作者在保护个人隐私方面提出了几种想法。

一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。作者同时也指出了这两种方式的难度。

一方面收集到的数据可能会被后续的多次利用。另一方面,当越来越多的数据被收集并相互结合使用时,匿名性将变得无效。作者列列举电影《少数派报告》的情节说明越来越依赖数据时,大数据可能将我们禁锢在可能性之中。

当然,通过对犯罪多发地点、多发时间的分析,合理安排警力,对公安预防工作有很大帮助。作者还指出,由于不能保证从分析结果中得到的数据的准确性,我们不能相信数据的分析结果。大数据不仅为我们的生活提供了便利,也使得隐私保护的法律手段形同虚设。

我们必须杜绝对数据的过分依赖。

在大数据时代,人类信息管理标准需要重新定位,这将推动社会核心价值观的转变。大数据时代,对原有规范的修修补补已经不足以抑制大数据带来的风险。保护个人隐私就需要对个人数据处理器对其政策和行为承担更多责任。

同时必须重新定义公正的概念,以确保人类行为的自由。作者提出了解决这些问题的方向。如个人隐私保护方面,可以让使用者承担更多的社会责任。

将责任从民众转移到数据使用者有很多意义,也有充分的理由。因为他们更清楚将如何使用数据且是数据应用最大的受益者。关于公正方面简单的讲就是个人可以并应为他们的行为而非倾向负责。

就像公司有内部会计和外部审计人员一样,大数据时代,公司将设置专门的人员--内部和外部算法师对大数据活动进行监督。还有可能出现第三方的机构对大数据行为进行监督和衡量。作者甚至考虑到对大数据存在的垄断情况进行分析并在反垄断反面给了建议。

最后结语中作者提出大数据提供给人们的只是参***,提醒我们在利用这个工具时要铭记人类的作用是无法完全替代的。

大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个国家如此,对于一个企业亦是如此。在如此快速的到来的大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。

公司的规划中,也需充分考虑到大数据对于公司的未来发展所带来的机遇和挑战。对于掌握大量数据的公司,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?比如国内目前的社交**,购物**等都掌握了用户的大量的数据信息。

对于没有掌握数据的小公司来说,在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给其他企业或个人带来价值。从国家层面来讲,要做好各方面的规划和政策调整的准备。如对隐私的保护等需新的法律法规进行规范。

大数据时代读后感 篇2

《大数据时代》一书,让我们在观念上有了三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。该书介绍了“大数据”时代的三大变化:

思维变革,商业变革和管理变革。在这些巨大变革如洪水一般的"冲击"之下,现代社会的运作方式必将有重大的改变,若不顺应这种变革的潮流,就像古中国固步自封,最终被坚船利炮打开国门而自己还用着长钩铁戟抗争一样,不可避免被掠夺,被落于世界进程之后,所以我们必须转变我们的思想。

“我们不再有兴趣寻找因果关系,而是应该寻找事物之间的关联”,我认为这句话是本书的核心思想。大数据时代,信息与数据已成为了一切的本源,我们生活在各种数据构成的海洋之中,如果从另一种视角看,就好像无数条"看不见的线"将我们与这些数据联系到一起,这是我们以前从未有过、从未想过的。大数据改变了我们以前的通过因果关系了解世界的方法,而提供了几种新的途径,因为,在大数据时代,我们可以分析更多数据,有时甚至可以处理和某个特别现象相关的所有数据,也就是:

样本=总体;而且,当研究数据如此之多时,我们已不热衷于"精确",而是"混乱",若不接受"混乱",那么有95%的非结构化数据无法利用,这将无法使我们构建完整的数据世界,在分析更多、更全面的数据之后,我们就可以从这些数据之中发掘它们的相关关系,即以"是什么"而不是"为什么"的角度看待数据,不用管其从何而来,只要分析其如何影响其他事物既可,即"让数据自己发声",这些,彻底推翻了人类以前探索数据的方法,展现了一个全新的世界。

这一概念以惊人的力量给当前的知识状况带来了巨大的冲击。通过对海量数据的分析,我们可以获得巨有巨大价值的产品和服务,或者是深刻的见解。例如,当h1n1在xx流行时,google通过检测搜索关键词并处理了34个。5亿个不同的数据模型,通过**并与xx、xx年的美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,**结果与官方数据相关系数高达97%,这种大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为**流感提供了一种更快速、高效的工具。

同时,虽然大数据可为人类造福、对抗病症,但这仅限于掌握这门技术而言,若不重视这种技术,当我们的对手早于我们一步构建这种数据网络之时,便是我们的灾难,想想,大数据虽核心的在于**,当敌人通过这种手段**我方下一步的行动,将是可怕的—比如你的导弹将从何处发射,将飞往哪,你的军队动向、目标,总之所有一切"未来"将掌控于敌手,敌方甚至可以借此发现那些将来有"大作为"的人,从而进行渗透或扼杀,这对我们的发展无疑是致命的,所以,尽快加速大数据系统的构建进程是必须的。

对于我们国防生,也必须顺应这种发展趋势,未来的时代必将是数据极易获取,数据网络共享化的时代,通过这些数据,建立数据模型,可以准确分析并给出适合每一个人的计划,如运动量、训练强度,可以"先知、先觉",及时发现一个人的负面情绪前及时疏导,这些必将成为现实,我们必须跟进时代,做好准备,去应对大数据时代的一切!

《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。这本书最大的优点是作者用数百个例子详细解释了大数据的方方面面,使外行容易理解。在结构上,笔者依次从大数据时代的思维变革、业务变革和管理变革三个角度进行阐述,清晰有序。

作者认为,所谓的“大数据”就是“所有数据”。随着计算机运算速度和存储容量的不断提高,数据采集变得越来越简单,数据存储的成本也越来越低。过去,由于技术上的限制,人们在进行统计时只能采集有限的样本数据,在统计中应考虑随机样本的选取,以减少样本问题带来的误差;统计结果往往不被重用,导致数据利用率低。

而现在则可以做到"样本=总体"。数据的增多带来不可避免的精确性问题。在“小数据”时代,样本的误差会导致整体估计的失败。幸运的是,在“大数据”时代,准确度不再那么严格——也不能太严格——数据的数量足以弥补这一缺陷。

在对思维转换的阐述中,本书最重要、最核心的一点是大数据时代。我们应该从追求“因果”的旧思维模式转向追求“关联”。 在我看来,这实际上是通过大数据来透视一种事物的发展趋势,而很多精确学科领域依然需要探寻"因果关系"解决更有针对性的问题,所以,这局限了这一转变只能在特定的领域发生。作者本人也说,“大数据的相关性使人们看到了比因果关系更具前景的领域。

“在大数据时代,获取数据的方式多种多样,数据形式也在发生变化。任何文本、行为和一切都可以在数字化后进行分析。对于这些数据的利用,我们不仅要考虑其最初的使用价值,还要考虑其未来可能的用途,以提高数据的利用率。当然,数据的使用并不是无限的,而且时间效应和环境的变化肯定会对数据提出新的要求,所以数据的折旧也应该考虑。

这就导致了对数据(一种无形资产)进行估价的可能性。对于facebook和twitter这样的公司来说,数据是他们的核心。如何让他们在资产负债表上得到公平的反映是我们需要考虑的问题。

大数据时代的价值链由三部分构成,我把它们简化为"生产—分析—使用"三个环节,这对应书中的三种类型公司: 第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。在大数据出现的早期,技能和思维是最有价值的,但笔者认为,归根结底,大部分价值必须从数据本身挖掘出来。

这假设一个成熟的市场,每个人都了解大数据的使用。

对于普通人来说,隐私是大数据时代最重要的问题。不知不觉中,个人的每一个行为都暴露在**甚至是民营企业的面前,也面临着潜在的信息披露风险。对此,笔者提出了解决用户责任的办法,而不是以往的正式授权使用。

大数据甚至可以**一个人的犯罪动机,这就给监管部门带来了**一个人是否想犯罪、惩罚与否的问题?在这方面,社会必须达成一个共识,即“个人只需对其行为负责,而不是对其动机负责”。

大数据时代的风险控制靠的是"算法师",类似会计师一样的职业,对大数据的准确度或有效性进行鉴定。这在一定程度上可以防止数据滥用和数据**的发生。今天的法律也需要对大数据监管进行修正和补充。

如今的大数据发展主要是由科技公司推动的。相信在不久的将来,更多的传统领域会认识到大数据的重要性。但我们也应该保持清醒。大数据不是灵丹妙药。对于某些领域或链接,使用大数据是一个简单使用的选择。但对一些地区来说,盲目使用大数据只会适得其反。

大数据时代读后感 篇3

随着计算机技术与社会生活的全面融合,信息**开始积累

发变革的程度。它不仅向世界提供了前所未有的信息,而且其增长速度也在加快。每个人口袋里都有一部手机,每个办公桌上都有一台电脑,每个办公室都有一个大型局域网,让我们日常生活的每一个痕迹都变成了数据。

生活在信息时代,我们应该积极改变原有的思维方式,迎接大数据时代,发掘大数据的价值,创造更美好的未来。这是一个样本=整体的时代,这是一个利用大数据来遏制错误的时代,这是一个注重相关性的时代,我们将从全球的角度来看待所有的数据和分析我们的问题。

“有时候,当我们掌握了大量新型数据时,精确性就不那么重要了,我们同样可以掌握事情的发展趋势。大数据不仅使我们不再期待精确,而且使我们无法实现精确。然而,除了在一开始就与我们的直觉相矛盾外,接受数据的不准确和不完善也能使我们更好地**和理解世界。

”之前受统计方法的限制,我们只能尽可能的收集到有效精确的数据,依靠可怜巴巴的小样本估计去总体,但在这个大数据时代,我们可以掌握所有的数据,让总体都成为我们的样本,收集所有相关的数据,指引出事件发展的方向。因为有大量的数据,我们不需要关心每个数据的可靠性和准确性。我们需要改变原有的思维方式,学会容忍错误,接受数据的不准确和不完善,要从大规模数据中获得利益,混乱应该是一种标准的方式,而不是试图避免。如果我们忽视微观层面的准确性,我们将在宏观层面有更好的洞察力。

面对大数据,我们需要改变原有的观念,不是追求每一个样本的准确性,而是以宽广的胸怀接受大数据,以宏观的思维**事物,得出结论。

“同样地,人类从依靠自身判断做决定到依靠数据做决定的转变,也是大数据做出的最大贡献之一。行业专家和技术专家的光芒将因统计人员和数据分析师的出现而黯淡,他们不受旧观念的影响,能够倾听数据的声音。他们的判断建立在相关关系的基础上,没有受到偏见和成见的影响,这就如同莫里中校不把干瘦的船长在酒吧喝酒时所说的航道信息当真一样。

他们的判断完全取决于所收集的数据所显示的实际信息,因此它具有坚实的基础。莫里所采用的方法并没有解释风向和水流为什么是这样的原因,但是对于想安全航海的航海家来说,“什么”和“哪里”比“为什么”更加重要。”

大数据时代我们不再仅凭自身经验来做决定,而是能了解到大多数人的判断来行动,并能在这些数据中发现比我们预想中还要多的信息,它们不受时间地点的限制,没有个人偏见的影响,将实际的信息毫无保留地呈现在我们眼前,也许到最后我们并不知道为什么,但我们一定很清楚该怎么做,技术的发展得以让我们纵横地观察事物,包容一切与之相关的信息不管错误与否,视野得以开阔,我们的思维也得以开阔,洞彻万物。

“过去,一旦数据的基本用途实现了,我们便认为数据已经达到了它的目的,准备将其删除,让它就此消失。毕竟,数据的首要价值已经得以提取。在大数据时代,数据就像一座神奇的钻石矿,在挖掘出原始价值后,仍然可以产生价值。

数据的潜在价值有三种最为常见的释放方式:基本再利用、数据集整合和寻找“一份钱两份货”。数据的折旧值、数据耗尽和开放数据是比较独特的方法。

”我们的每一次搜索,每一次点击,在网络平台写的每一句话都会成为数据,在日常生活中我们不知不觉的产生了很多数据,然而我们却没有意识到他们的作用。当我们把这些数据放在一起,我们会发现一些新的东西。看似无用的纷繁数据,却暗示着某种规律与事实。

人们无意中点击,却会暴露出你的兴趣爱好等信息。大量的信息是一个商机的发现,它将带来新的产业链。看似简单的寻访,也将反映当前人民的意愿和社会的需求。当我们不再依靠小样本来推测整体,而是直接联系整体时,我们应该学会从不同的角度挖掘其潜在价值,重用数据,从大数据中洞察我们所需要的信息。

无论大数据如何威胁隐私保护,行为倾向都是人们最头疼的问题。大数据**的准确性越来越高。它可以**行为的发生,在人们犯错之前预先惩罚他们。因为共产党的结果几乎是无可辩驳的,人们不能为自己辩解。

但是这种基于**的惩罚不仅违背了自由意志的原则,而且否定了人们突然改变选择的可能性(无论多么小)。当我们判断一个人的责任(和惩罚)时,我们必须牢记人类意志的神圣性。人类的未来必须保留一些空间,让我们能够根据自己的意愿来塑造。

否则,大数据会扭曲人类最本质的东西,即理性思维和自由选择。

即使有一天我们能仅仅依靠之前所收集的数据**一个人未来犯罪的可能性,我们也不能因此而逮捕某个人,也许在事发之前阻止能避免很多损失甚至挽救许多人的性命,但人的意志是可以改变的,人有悔过前非,重新向善的权利,我们不能在一个人还没犯罪之前就扼杀他向善的可能性,不然我们将失去心灵最美好的本质,成为死板的数据的奴隶,我们的思维终葬在自己制造的枷锁中。科学技术的进步不能扼杀人的意志。不管有多少数据,只有灵活的大脑才能把它变成一个更好的未来。

大数据时代读后感 篇4

读《大数据时代》有感

“一个富于创造力却又充斥着巨大破坏力的大数据时代已经来临。”7月19日,凤凰卫视董事局主席刘长乐在生态文明贵阳国际论坛上如是说。然而只有当我真正翻开《大数据时代》这本书,我才对何为大数据有了深刻的印象。

以下为余之于大数据之拙见。

背景:互联网和流**的应用,信息的扩展,节奏的加速。

什么是大数据:收集和分析大量信息的能力,涉及到人类生活的方方面面,以便从复杂的数据中找出过去不易揭示的规律。

特征(三个原则):

1.不是随机样本,而是全体数据。

依据舍恩伯格教授强调全体数据处理的好处:

其一,揭示样本数据无法搜寻的细节信息。故而相比样本数据的局限与限制,大数据其实更具精确性。

其次,大数据处理的简单算法要比小数据处理的复杂算法简单得多。对“小数据”而言,第一要义便是减少错误,保证质量。因为从小数据中采集的少量样本意味着小误差放大,甚至可能影响整个结果的准确性。

第三,我想说的是,时代的特点决定了信息处理的方向。对精确性的痴迷实际上是缺乏信息和模拟时代的产物。在那个信息匮乏的时代,对每一个数据的测量都对结果至关重要。然而,当今社会是一个飞速发展的时代,信息复杂,更换频繁,大数据库每天都以不寻常的速度更新。

然而并不是说对于教授的观点我是完全认可的。比如人口普查,不管计算机有多强大,目前仍有很多数据需要人工采集,所以这次人口普查仍需要采用抽样的方法。有意思的是,教授用人口普查是抽样分析来说明非“全量”时代我们被迫采用了抽样,而最终也没法说我们是否已经可以用全量数据来做人口普查了。

教授的行文中,关于什么是“全量”,处于不断的摇摆之中。有时指“我们需要的所有数据”,有时指“我们能收集到的所有数据”。教授举了一个人口普查的例子,很明显是指前者。

而在很多商业案例中,又显然指后者。我们有能力处理越来越多的、在以前不敢想象的大量数据,全体数据的收集的好处显而易见,但是至少目前看,我们还没不可能说我们处理了“全量”。

2.不是精确性,而是混杂性。

在我看来,在大数据时代,细微差别的不精确性的确被忽略了。实际上,混合应用提高了搜索的容错性。举个简单的生活事例,当一个人搜索偶然在街边听到的心动的歌曲,隐约记住了几句歌词可能都不正确。然而,随着关键词的输入,他搜索歌曲的概率将大大增加。

3.不是因果关系,而是相关关系。

对于这个观点,教授引用了谷歌的一个例子:谷歌搜索关键字来确定**是否可能有流行病。依据教授的观点,寻求是什么而不是为什么可以大大减少人们所需要的耗资,更值得一提的是相关关系在某些方面涵盖面相较于因果更加广泛,故而给人提供了新的可能在寻求因果关系被蒙蔽的视角。

因此,第三点也是教授和大多数人认为最有价值的一点。

可是我想说难道在寻求相关关系的时候就一点都没有因果关系的存在吗?难道在谷歌凭借关键词找到流行病区域就一点都没有因果关系的运用吗?我们只能说并不是一味的追根究底,然而要说完全没有就太过绝对了。

正如舍恩伯格教授指出这是一场思维的巨大变革,然而依余拙见,其中问题尚存,需要建立完善的大数据体系还有很长的路要走。

应用:(商业)

大数据的核心即**

大数据价值链的三大**是数据本身、技能和思维。

最先自然受益的公司是那些掌握大数据的公司:基于数据本身的公司、基于技能的公司、基于思维的公司。其次,拥有数据洞察能力和思维能力的个人往往是富有和成功的。然而,更宝贵的不是财富,而是他们对数据的独特洞察。

隐患:人类被绑架到一个没有隐私的真空世界。

大数据时代中有可能爆发数据垄断的危机,并将催生出形形色色的数据弱势群体。

在数据的生成或收集过程中,不可能实现绝对平等。一些信息记录通过博客、微博等自**及社交网络传遍全世界的同时,各种个人信息被当做商品待售甚至已经**,“网上人肉”、各种****事件是典型依靠海量数据对弱势群体产生的摧毁性打击。大数据就像一台巨大的推土机,它破坏了国家、社会和个人的信息保护。

然而对其中的所有观点都不假思索的采纳而不深入探索质疑的做法并不是值得效仿和推崇的。

大数据时代读后感 篇5

《大数据时代》

读书分享

一、开篇

《大数据时代》这本书主要描述的是大数据时代到临人们生活、工作思维各方面所遇到的重大变革。本文明确阐述了大数据的基本概念和特点,并列举了清晰的观点。

作者将本书分为3个部分。第一部分提出了大数据时代处理数据理念上的三大转变:抽样等于全体;要效率不要绝对精确;要相关不要因果;第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后一部分,作者描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。

二、大数据的概念

“大数据”是一个数据量大、数据种类多的数据集,传统的数据库工具无法对这样的数据集进行抓取、管理和处理。

三、大数据4个特点

要理解大数据的概念,首先要从大数据入手,大数据是指数据规模,大数据一般是指

10tb(1tb=1024gb)规模以上的数据量。大数据同过去的海量数据有所区别,

其基本特征可以用4个v来总结(vol-ume、variety、value和veloc-ity),即体量大、多样性、价值密度低、速度快。

1、数据体量巨大。从tb级别,跃升到pb级别。

2。有许多类型的数据,如网络日志、**、**、地理位置信息等。

3、价值密度低。以**为例,在连续监测过程中,可能有用的数据只有一两秒。

4、处理速度快。1秒定律。最后,它与传统的数据挖掘技术有本质的区别。

物联网、云计算、移动互联网、车联网、手机、平板电脑、个人电脑和各种传感器遍布世界各地,都是数据**或承载的方式。

四、大数据时代处理数据理念上的三大转变

首先,关于不是随机样本而是整体数据中。指出在小数据时代,随机抽样是用最少的数据获得最大值的方法。作者使用大数据和乔布斯的癌症**来说明使用所有数据而不是样本的重要性。

乔布斯成为世界上第一个对他所有的dna和肿瘤dna进行测序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然他最终死于癌症是不可避免的,但这种获取所有数据而不是仅仅获取样本的方法延长了他几年的寿命。

其次,关于要效率不要绝对精确,作者指出随着数据使用的越来越多,其得出的结果并一定能越来越精确,毕竟数据不能保证百分之百的正确,特别是大数据时代各种结构化与非结构化类型的数据聚集在一起难免导致结果的不太精确。大数据时代要求我们重新审视准确性的优缺点。作者特别举了谷歌翻译成功的例子。

google translate优于ibm的candide系统,并不是因为它有更好的算法机制。和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(它的语言库来自未过滤的web内容,它将包含一些不完整的句子、拼写错误、语法错误和各种其他错误。)

最后,在相关而不是因果关系这一章。作者指出,在大数据时代,知道什么比为什么更现实。作者列举了林登亚马逊推荐系统的成功案例,证实了大数据在相关性分析和销售成功方面的优势。

沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表,从以前广为人事的啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于其策略的帮助。建立在相关关系分析法基础上的**是大数据的核心。aviva insurance利用数百种生活方式的数据,如兴趣爱好和长时间的网络浏览,间接确定谁更容易患高血压、糖尿病和抑郁症。

ups国家快递公司通过使用**性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了**大数据的优势。

5、 大数据在各行各业的应用与典型案例共享

六、大数据的优点和隐忧

七、大数据时代的思考启示

八、故事分享

一家披萨店的**响了,客服人员接了**。

客服:***比萨店。您好,请问有什么需要我为您服务?

顾客:你好,我想要一份……

先生,请先告诉我您的会员卡号码。

顾客:******。

客服:陈先生,您好!您是住在泉州路一号12楼1205室,您家**是2646****,您公司**是4666****,您的手机是1391234****。请问您想用哪一个**付费?

顾客:你为什么知道我所有的**号码?

客服:陈先生,因为我们是**crm系统。

顾客:我想要一个海鲜比萨……

客服:陈先生,海鲜比萨不适合您。

顾客:为什么?

客服:根据您的病历,您的血压和胆固醇偏高。

顾客:那你们有什么可以推荐的?

客服:您可以试试我们的低脂健康比萨。

顾客:你怎么知道我会喜欢吃这种的?

客服:您上星期一在**图书馆借了一本《低脂健康食谱》。

顾客:好。那我要一个家庭特大号比萨,要付多少钱?

客服:99元,这个足够您一家六口吃了。但是你妈妈应该少吃点。她上个月做了心脏搭桥手术,现在还在**中。

顾客:那可以刷卡吗?

客服:陈先生,对不起。请付现金,因为你的信用卡已经被刷爆了,你还欠银行4807元,还不包括房贷利息。

顾客:那我先去附近的提款机提款。

客服:陈先生,根据您的记录,您已经超过了今天的取款限额。

顾客:算了吧。你可以直接把披萨送到我家。家里有现金。你们多久会送到?

客服:大约30分钟。如果您不想等,可以自己骑车来。

顾客:为什么?

客户服务:根据我们的crm全球定位系统,车辆行驶自动跟踪系统记录。您注册了一辆车,车号为sb-748,现在您正骑在解放路东段华联**右侧。

顾客当即晕倒。

大数据时代读后感 篇6

这么多年来,看了很多东西,如今回过头来发现,好像什么都忘了,真是悲剧,所谓读书破万卷,下笔如有神或许是不对的,还是需要下笔勤快,所以决定从这里开始。

这些年对于技术的发展,我是没有跟上,如今发现即便是对于投资,技术对于我们生活的改变太大,而自己身在这个技术浪潮的前沿,还是需要跟上步伐。

——前言

大数据的概念提了很久,我一直忽略了对它的理解。看完《大数据时代》,再结合如果工作上对于大数据的理解,顿时发现数据的重要性,以前在这方面的确没有足够的思想意识。

对于整本书,我认为三个要点是前几章:

、要总体,不要随机样本:从小对于统计学相关的学习,基本都是从样本出发,理论的基础在于如何随机的足够分散的选取样本,这可是技术活加直觉。对于大数据来说,这是一个整体。从本质上讲,整个样本可以更准确地找到结果。

但是对于统计来说,总体的分析增加了数据分析的难度,不仅数据核对不好进行,一旦出现数据污染,准确度就会大打折扣,而且进行数据回溯的时候,也无法准确确认问题,而这一点也是后面相关性上问题;

2、要混乱,而不是精确:这里主要想说明的是希望数据的多样性,尽量将相关数据都收集起来,不管是结构化的还是非结构化的。这样就不可避免的最终结果的不准确性。

大数据更多的是从一个总体数据中说明以后概率事,既然是概率,也就可以理解无法精确。这里有个点的说明,我觉得需要提一下,大数据算法更倾向于“简单”,而不是复杂,这个倒是出乎我的意外。

3、要相关性,而不是因果:从我对于知识获取的过程来说,我是不同意这个观点,从人体对于知识的理解,还是要从因果论出发,没有因果论,就会变成瞎子。而作者的观点上来说,原因可能还是从大数据本身的非准确性,一旦找到合适的算法,找到相关性,向上追述原因本身就很难。

但是从举的示例上看,相关性的确认是一个非常大的工程,基本就是使用排举法,一个一个试。

大数据时代读后感 篇7

在看《大数据》之前,我只知道社会越来越数字化了,看完之后,才觉悟到:人类将迎来一个新的时代。

数字化已经把我们带入一个信息时代,大数据却把我们卷进了一场科技风暴之中,这本书中,作者为我们开启了一个更包容更广阔的新时代,大数据把社会的方方面面融合在了一起,曾经看似因果联系紧密的事物,可能变得不再那么重要;毫无关联的事物,可能隐藏着重要的信息,从科技、商业,到医疗、政治、教育、文化,大数据一概席卷囊括,它改变着我们的传统思维,为这个时代注入了新鲜的血液,就像作者书中所说:“这项技术终将改变我们所居住的星球上的许多东西。”

大数据最显著的影响是,对于电子商务来说,通过大数据,最显看到潜在市场的将是最显占领市场的。电子商务对工业的影响势不可抗拒的。由此可见,掌握大数据主导市场,只有拥有先进的技术,才能拥有坚实的竞争力。在医疗方面,非典时期就是一个很好的例子。正是大数据的**功能是一情得到控制。

从较小的方面来说,他也改变了我们的生活。书中提到,美国著名计算机专家奥伦·埃齐奥尼发明了机票软件,这是一个利用大数据造福我们生活的好例子。

大数据不仅节约了时间,提高了效率,而且把人类带入了文明的新阶段。从分析因果、总结经验,到为未来收集数据;从最初的滞后到现在的前瞻,极大地提高了人类认识世界、改造世界、由被动变主动的能力。大数据为我们掀开了历史新纪元,不敢想象它将会为我们带来什么,或许会出现新奇的生活方式,从未有过的职业,闻所未闻的商业模式,百家争鸣的文化高峰;也或许会解开更多未解之谜,探索到宇宙之外的秘密。

总之,毫无疑问,大数据带来的未来是超乎想象的。

作者在这本书中提到的最多的是:改变我们的传统思维,放弃精确,转向宏观。从总结因果转向**。

这个世界正以惊人的速度向前发展,数据大**的波及范围远超乎我们的想象,单纯靠人类的主观判断力是多么的有限,大数据早晚会取而代之这一现象,这必将影响我们的生活和工作,我们也只有认清这种趋势,改变思维,调整步伐,紧跟时代才行。即使不能与时俱进,也要尽量避免自满,认清大数据,用大数据谋利避弊,造福生活!

大数据时代读后感 篇8

近几年, “大数据”这个词频繁地出现在人们的视野当中,它不仅被写入阿里巴巴、 谷歌等互联网公司的战略规划中, 同时在我国国务院和其他国家的**报告中也被多次提及,甚至在我的家乡内蒙古自治区,乌兰察布市集宁区也已经耗资15亿建成了华为云大数据中心,将来还要发展成内蒙古的大数据中心。这些改变都使我对大数据产生浓厚的兴趣。 因此通过多方途径了解后,最终决定以《大数据时代》一书,作为我进一步了解大数据的入门书籍。

《大数据时代》一书是由英国作者维克托迈尔舍恩伯格所著。 主要描述了大数据对21世纪人们生活、工作与思维各方面所做出的重大变革。

这本书的作者舍恩伯格是大数据领域最受尊敬的权威演讲者之一。 他二十多年来一直致力于网络经济、 信息与创新、 信息监管、 网络规范与战略管理方面的研究, 从维也纳大学到哈佛大学, 从新加坡国立大学到牛津大学, 很多世界上著名的互联网研究学府都留下了他的足迹。他宽广的学术视野和系统的学术造诣,使他不断为企业和企业应用提供强有力的理论支持。

他的咨询客户包括微软、 惠普、 ibm 、亚马逊、 facebook 、 twitter 、 visa 等大数据先锋们,所以在《大数据时代》一书中, 他将掌握的最前沿的大数据应用案例给予充分的分析, 并对大数据的价值链与角色定位给予清晰的预见。

首先,舍恩伯格明确阐述了大数据的基本概念和特点,并列举了清晰的观点。 不管对于产业实践者, 还是对于**和公众机构, 都非常具有价值。作者将本书分为3个部分。

第一部分提出大数据时代数据处理观念的三大变化:不是随机样本,而是全部数据;不是准确性,而是杂合性;不是因果关系,而是相关性;

第二部分作者从万事万物数据化和数据交叉复用的巨大商业价值两个方面, 讲述大数据最核心的模块:一切皆可数据化,并阐释了数据的新价值和其运用方法;

第三部分阐述了大数据的出现可能引起的关注和隐患,包括产业生态环境、数据安全与隐私、信息公平与公开等。

刚看到第一部分时,作者便向我们阐述了一个奇妙的“云时代” 。他认为在抽样研究调查的时期, 由于研究的条件欠缺, 只能以少量的数据获取最大的信息,而在现在,无论是计算量还是计算速度,我们都达到了一个比较好的高度,我们可以在很短的时间内获取到海量的数据。因此如果我们以更多甚至是与之相关的全部数据去分析一个事物,就可以让我们更清楚地看到以前无法揭示的细节信息。

我看过一个管理方面的例子,从大数据分析得出结论:一般来说,我周末去超市购物

婴儿用品的父亲通常去啤酒区买啤酒,而其他产品很少出现在他们的购物车上。通过这一分析,超市管理者将婴儿用品和啤酒分别放在最远的距离区域,消费者会注意到来回中间的商品,从而增加了购物量和超市的利润。而如果只是分析抽样数据的话,我们就无法确定购买婴儿用品的人与父亲们与啤酒之间的这种关联,自然也就不会做出将婴儿用品和啤酒分开放在了相距最远距离的区域这样的举动了。

同时,笔者也指出,随着数据使用量的不断增加,结果并不一定更加准确,特别是在大数据时代,各种结构化和非结构化的数据必然会导致不准确的结果。大数据时代要求我们重新审视准确性的优缺点。作者特别举了谷歌翻译成功的例子。

google translate优于ibm的candide系统,并不是因为它有更好的算法机制。 和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。 (其语库来自于未经过滤的网页内容, 会包含一些不完整的句子、 拼写错误、 语法错误以及其他各种错误)。

不是因果关系,而是相互关系的一章。

作者指出,在大数据时代,了解大数据时什么比为什么会出现更现实。作者列举了林登亚马逊推荐系统的成功案例,证实了大数据在相关性分析和销售成功方面的优势。 沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表, 和我刚才所介绍的啤酒与婴儿用品的案例, 以及作者举的有关蛋挞和飓风天气的案例, 都说明了掌握了相关关系对于其策略的帮助。

基于相关性分析的**是大数据的核心。aviva insurance利用数百种生活方式的数据,如兴趣爱好和长时间的网络浏览,间接确定谁更容易患高血压、糖尿病和抑郁症。 ups 国家快递公司通过使用**性分析检测其全美 6万辆车队。

进行防御性的修理,节约巨大得的成本。这些都充分显示了**大数据的优势。

接下来的第二部分,作者讲的是大数据时代的商业变革。

作者用莫里绘制导航图的例子告诉我们, 远在信息数字化之前, 对数据的运用就已经开始了。莫里用大量的人力分析了他保存多年的航海记录,从这些大量的数据中获得了新的利用价值。绘制的图表帮助商人节约一大笔钱, 使年轻的海员们间接获取了成千上万名经验丰富的航海家的指导。

日本先进工业技术研究所崇臣教授通过安装压力传感器,将人体臀部特征数字化,进而形成乘客身份识别。这项技术为汽车防盗系统提供了方案。 mastercardd.

顾问部分析了210个国家15亿信用卡用户的650亿笔交易

易记录,分析得出商业发展和客户消费趋势, 如通过分析发现如果一个人下午四点左右给汽车加油的话, 他很可能在接下来的一个小时内去购物或者去餐馆吃饭 ,且在这一小时里大约花费 35到 40美元。 商家正可以利用这个分析结果, 在加油的小票背面附加上附近商店的优惠券。这些例子证明了大数据具有巨大的商业价值。

大数据价值链根据**提供价值的不同分为三个部分。 包括第一种是基于数据本身的公司。这些公司拥有大量数据,或者至少可以收集大量数据,但他们不一定具备从数据中提取价值或利用数据产生创新想法的技能。

第二种是基于技能的公司。它们通常是咨询公司、技术**商或分析公司。 它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。

例如,沃尔玛和波普馅饼是两家通过对天睿公司的分析来获得营销理念的零售商。天睿是一家大数据分析公司。 第三种是基于思维的公司。皮特 .

华登, jetpac 的联合创始人,就是通过想法获得价值的一个例子, 他通过用户分享到网上的旅行**来为人们推荐下一次旅行目的地。 对于某些公司来说, 数据和技能并不是成功的关键。挖掘数据的新价值的创新思维才是这些公司脱颖而出的优势所在。

这就意味着,在现在这个时代,掌握了大数据就相当于掌握了与其他企业竞争的竞争力。如何更快更廉价的提取、保存数据,如何正确的利用数据成为了当今企业需要关注的一个重点。一旦成功的掌握了大数据,不但可以超过现有的对手,甚至可以遥遥领先。

本文的第三部分讲了大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。包括如数据的收益的处理问题以及数据中用户资料的隐私和决策过程带来的影响。

举个最近的例子,阿里巴巴的大数据处理能力在**这一款电商软件上体现的淋漓尽致。通过分析大数据很多情况下都会推送到你想要购买的商品以及最合适的**,为我们带来了很多的便利。但同时支付宝的隐私门丑闻,偷偷调用摄像头录像偷偷调用麦克风录音的行为,被爆出之后也让我们心有余悸。

然而这仅仅是个典型案例。

真正被别人翻遍隐私却茫然不知的例子太多了。比如网易邮箱,去年被乌云爆出被拖库,几亿用户密码密保问题泄露,然后大家一阵哗然。实际上圈里人都知道,网易邮箱这些年被拖库就像月经一样,根本就是公开的秘密。

2011年出现过一个新闻,一款叫做ciq的预置在所有苹果手机和运营商定制的安卓手机中的app,会窃取用户隐私数据,包括联系人、短信等,每隔72小时就会发送一次数据到位于美国的服务器。

而作者在保护个人隐私方面提出了几种想法。 一种是使用数据时征询数据所有个人的知晓和授权。 第二个技术途径就是匿名化。

作者同时也指出了这两种方式的难度。一方面收集到的数据可能会被后续的多次利用。另一方面, 匿名化会在数据收集越来越多和数据的相互结合关联使用时变得无效。

作者列列举电影 《少数派报告》 的情节说明越来越依赖数据时, 大数据可能将我们禁锢在可能性之中。当然通过分析犯罪的常发地与常发时间, 合理安排警力会对治安防范提供不小的帮助。

尽管如此,我们也必须要知道, 大数据在给我们生活提供便利的同时, 也让隐私保护的法律手段失去了作用。我们必须杜绝对大数据的过分依赖,作者也在文章的结尾提到了大数据提供给人们的只是参***, 我们在利用这个工具时要铭记人类的作用是无法完全替代的。

大数据是时代发展的必然趋势,在读完本书后更加确信了这一点,但在运用大数据的同时,我们也要深知大数据为我们提供的不是最终答案,只是参***,而更好的方法和答案还在不久的未来。我们还需要不断的学***索。

大数据时代读后感 篇9

我们不再对寻找因果关系感兴趣,而是应该寻找事物之间的关联。这个命题是我读这本书最大的感触。个人认为也是这本书最核心的思想。

从头说起吧,首先,书提出一个颠覆我以前认知的命题--“并非原子而是信息才是一切的本源”,将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视下是的视角。它是一种可以渗透到所有生活领域的世界观。这个命题是在书的最后一部分中的某一段中描写的。

我之所以把它放在第一位,是因为我认为这是谈论数据世界的前提,自然也是谈论大数据的前提。书的中间部分有一节讲到数据化和数字化的区别。在整理了自己的大脑之后,我把数据世界的命题列为大数据思考的第二步。

写到这里,我不由得反省下,我是不是有领悟到书的精髓所在(我认为的精髓),就是第一句话。因为回顾我的整个思想,我还是按照旧的因果关系模式来思考。书中另一个吸引我的地方是,有很多观点将从哲学的角度进行讨论。

虽然我的肚子里没有多少墨水,但当我读到这些描述时,我会发现我能更好地理解作者提出的命题。比如书中有一段文字

当我们说人类通过因果关系来理解世界时,我们指的是我们用来理解和解释世界各种现象的两种基本方法:一种是通过快速而虚幻的因果关系,另一种是通过缓慢而有序的因果关系。大数据将改变这两种基本方法在我们理界时界中的作用。

在附上一些事例的时候,用作者提供的“本质”去看待时,很容易理解,确实是这么回事。好吧,什么大数据改变了我们?作者给出了三点,

大数据的本质在于我们分析信息时的三个变化。这些变化改变了我们理解和建社社会的方式。

第一个变化是,在大数据时代,我们可以分析更多的数据,有时甚至可以处理与特定现象相关的所有数据,而不是依赖随机抽样(样本=总体)。

第二个转变是研究数据太多,我们不再热衷于精确性

第三个转变因前两个转变而促成,即我们不再对寻找因果关系感兴趣,而是应该寻找事物之间的关联。大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不需要知道这种现象背后的原因。我们只需要让数据说话。

正如大家所知道的那样,人类的大脑具备这样的功能,它会把新输入的刺激或信息与“过去的经验或积累的部分知识”相对照,然后进行调整并接受下来。如果你面前的新现实与你大脑中储存的内在信息不协调,你就会不自觉地拒绝接受新现实(好像你没有看到它);或者你可以通过你的半知识任意推测,让自己一识到情况偏离了现实(产生幻觉)。这是人的一种本能,目的在于使自己保持冷静。

所以作者称之为revolution。(革命)

讲了这么多,那么大数据到底给我们带来什么。在这里,我只想谈谈我的感受,其他感兴趣的人可以自己理解。当然,书中提了很多,最多的就是,什么公司或者个人利用大数据创造了多大的财富了,抛开这些表面的不说,最让我动心抑或者是害怕的是---预测。

这是大数据带来最核心的东西,动心的理由无须赘述,计算机会告诉你什么时候买什么双色球可以中头奖,想想心里是不是有一点小激动咧。当然这只是我打的一个比较夸张的比喻。至于害怕呢,书中有段话我很喜欢--- “公平正义的基础是人只有做了某事才需要对它负责,毕竟,想做而未做不是犯罪,社会关系于个人责任的基本信条是,人为其选择的行为承担责任。

如果大数据分析完全准确,那么我们的未来就会得到准确的预测,因此在未来,我们不仅会失去选择的权利,还会按照预测行事。如果准确的预测成为现实,我们将失去自由意志和自由选择的权利。既然我们别无选择,那么我们也就不需要承担责任。

这不是很讽刺吗。”

顺便说一下,这是书中对自由意志的另一种描述

在哲学领域,关于因果关系存在的争论已经持续了几个世纪。毕竟,如果每件事都有因果关系,那么我们就没有决定任何事情的自由。如果我们做的每一个决定或想法都是其他事情的结果。

而这个结果又是由其他原因导致的。这样,就不存在人的自由意志,一切生命轨迹只受因果关系的控制。所以哲学家们争论因果关系在世界上的作用。有时他们认为这是违背自由意志的。

书中举了个例子,举了部电影《少数派报告》,当我看到这里的时候,“哎哟,我居然看过这部电影,想想心里还是有点小激动”,有兴趣的可以去看下,大概就是讲警察通过预测来提前抓捕犯人,不过不是通过大数据,是通过超人类的方式。当你什么举动都可以被预测,相当于你完全暴露在太阳光下,换成你,你害怕不。

最后,附上一段结尾。

大数据并不是一个充斥着算法和机器的冰冷世界,人类的角色是不可完全取代的。大数据为我们提供的不是最终答案,而是参考答案。帮助是暂时的,更好的方法和答案还在不久的将来。

大数据最终会影响我们,和其他技术一样,它将是一把双刃剑,使用得当、移动、滥用和恐惧。如同核技术一样,用的话,造福地球,滥用,给个金刚石地球你,照样爆。我相信,未来大数据的发展将是一场人生、工作和思维的革命,正如笔者所说。

大数据时代读后感 篇10

还在大二的时候,本科的王艳明老师就向我们推荐了维克托.迈尔-舍恩伯格和肯尼思.库克耶所著的这本《大数据时代:

生活、工作与思维的大变革》(下文“《大数据时代》”均为概述简称),直到前段时间我才找将它从书架上拿下来品读。这本在2013年由浙江人民出版社出版的有关的大数据的著作在社会上掀起大数据热的时代,对众说纷纭的大数据的概念和特点以及有关问题进行了清晰地阐述,既给我补了很多有关大数据的知识,让我对大数据有了进一步的认识,之前一直是只闻其声而不见其庐山真面目,但同时也引发了我对大数据热的思考,特别是作为一名档案人,对当前档案行业中此起彼伏的“大数据热”的呼声有了清醒的认识。

一 、《大数据时代:生活、工作与思维的大变革》书目解读

《大数据时代》主要包含三部分:

第一部分:大数据时代的思维变革

这一部分主要阐述了大数据时代数据的三个特点,即多、杂、好。

作者通过“穿孔卡片与美国人口普查”“大数据与乔布斯的癌症**”“xoom 与跨境汇款异常交易报警”等生动、形象的实实在在的案例使读者信服庞大的数据在社会生活、商业活动等中所发挥的前所未有的作用,完美地体现“更多”的特点。试想,在需要数据运用的活动里,如果你所采用的样本不是随机的少数样本,而是以所需要的全部数据作为样本,那么你的最终结果将是多么的科学合理?

而在对“更杂”这一特点的阐述中,作者更是颠覆性地强调了数据的混杂性而不是普遍认为的精确性。同样是通过“微软与语料库数据增加”“英国石油公司与无线感应器”来肯定增加必要的“误差”的意义。在一直追求更小误差的科学活动中,这种方式无疑会扩大误差,因为数据量很小,那么一个数据的误差就可能会造成这个结果的不准确性大大提高,而在大数据时代,当面对的是全部数据时,那某些数据的大误差对研究结果的影响难道不能刻意忽略不计?

这本来是很容易理解的一个道理,然而在之前却并没有意识到。

在大数据时代,作者强调人民应该而且完全可以更多地强调数据或者现象的相关关系,而不是紧盯着它的因果关系不放。可以说,相关关系隶属于因果关系,因果关系作为社会与自然界中的重要关系当然是我们要努力探索和追寻的,但很多时候我们并不需要了解事件之间的因果,也不容我们慢慢了解“为什么”。特别是在商业活动中,各种机遇稍纵即逝,那么,相比“为什么”,“是什么”要更为容易,也更加迫切。

第二部分:根据时代的商业转型

“大数据发展的核心动力**于人类测量、记录和分析世界的渴望”。“如今的信息技术的变革的重点在‘t(技术)’上,而不是在‘i’(信息)上。现在,我们是时候把聚光灯打向 ‘ i’,开始关注信息本身了”。

这一部分,维克托.迈尔-舍恩伯格认为一切事物都可以“量化”,“用手机数据**疾病传播和城市繁荣”“睡眠活动数据库和睡眠模式**”这些例子中都说明了“量化”的巨大价值。作者提出了将文字、方位甚至沟通变成数据后的神奇作用,同时又强调了数据化和数字化的区别,不要将二者混淆:

数字化是指把模拟数据转换成用“0”和“1”表示的二进制码,而所说的数据化则是将现象转变为可制表分析的量化形式的过程。

在这一部分中,作者还阐述了数据创新的巨大价值以及技术、思维和数据在三大数据时代的作用。人们认为,思维和技术的时代应该让位于数据主导的时代。有了数据为师,有了数据,我们就有了一座巨大的宝库,很快就会成为取之不尽,用之不竭的宝库。

第三部分:大数据时代的管理变革

作者论述了数据主导一切的隐由与风险,以及信息管理的自由与责任控制。其中,让我印象深刻的是“**与惩罚,不是因为‘所做’,而是因为‘将做’”和“个人隐私保护,从个人许可到让数据使用者承担责任”。当下,人们对数据分析功能和信息推送服务乐此不疲,很少考虑到其在法律乃至伦理中的应用,但作者就屏辟蹊径地谈论了基于大数据的信息分析可能存在的问题。

认为,倘若将来分析到了一个人的信息使用记录而推断出其可能会违法犯罪,并因此而让执法人员破门而入去抓捕“罪犯”,理由是他将要犯罪,想想,是不是会很滑稽而且很可能会让社会恐慌?是的,它确实保障了社会保障,但也严重损害了司法公正。而在个人隐私方面,过于强调隐私导致谈信息而色变也是万万不可取的,但,我们是不是就应该忽略个人隐私保护呢?

绝对不是。首先,许许多多有用的数据并非是个人隐私信息,许多信息在搜集时并不会侵犯个人隐私,也无意用作其它用途,而且最终还产生了非常大的价值。其次,面对问题不是逃避,我们要做的是补救和解决问题。

要通过各种手段去迎接个人隐私侵犯的挑战。

二 、对大数据时代的理性思考

阅读《大数据时代》让我对大数据的概念和特点有了系统的了解,也让我能够更为清楚、理性地去看待大数据,去看待四面八方传来的此起彼伏的各种对大数据时代的呼声。大数据是洪水猛兽还是福音?这全在人类怎么合理地使用。

另外,《大数据时代》让我这位即将跨入档案工作者行列的档案学专业学生对自身专业领域内大数据的呼声甚至可以说是对“大数据”现象有了新的思考。

作为一名不太受社会和工作单位重视的、感受不到“钱途”的准档案工作者,一方面是希望档案行业也能够在大数据时代中分一杯羹,希望能够让档案信息发挥更大的价值,借此让社会和单位领导能够对档案工作和档案人员予以足够的重视,从而带来“钱途”和前途。不过,我还是要考虑实现这一美好愿景的可能性。很抱歉给它泼冷水。

简单地说,从技术和数据两个方面,我认为档案工作者没有明显的优势。

从技术上讲,档案员基本上没有优势。对信息技术的理论掌握和实践操作的熟练程度都是远远不如其他专业的人,特别是计算机技术和网络技术人员,甚至连档案学近亲-图书情报工作者都未必比得过。有多少人对数据库、文件管理系统、文件管理系统、文档集成管理系统等有深刻的了解?

更不用说设计和开发了。当然,你可能会说,为什么你需要了解和发展自己,而不是把它留给一个专门的技术人员?如果自己没有深入地了解,就难以和技术人员去很好地沟通,无法理解对方所说的功能等,只能表达自己想要的,而对方也未必懂你说的,只能双方装作都懂了的样子。

而且,如果你自己不掌握这项技术,就好像核心知识被别人控制,你仍然没有主动权。

而从数据角度来看,在这个数据为王的大数据时代(姑且认为已经进入了这个时代),对数据的掌控是核心,是关键。不可否认,档案中蕴含着丰富、权威、真实的有价值的数据,这是许多其他信息源所无法比拟的。但是,仍然有着两大独有的劣势。

一方面,档案信息很多都是具有保密性的,至少公开的范围是有严格的限制,而在秘密保存期限上也是很长久的,那么,这就造成了很多有价值的信息根本无法大范围流通,进而难以发挥其真正的价值,这种小范围流通的特点,注定了无法让这些数据大面积地在数据世界里自由流转。而另一方面,虽然档案信息的量是非常巨大的,但,档案是由符合条件的文件转化而来,对文件附加一系列约束之后才能被归档而形成档案。这就决定了档案的数量低于文件、文件和资料的数量。

数据量是大数据竞争的时代,我们如何才能强势竞争?

诚然,我虽希望大数据时代下档案工作者能够拥有适应大数据时代的素质,我希望能够使档案工作能够和大数据完美结合,能够于这个美好的时代走出一条更广阔而又不失自己本质和特色的路径。我希望我在想的问题不是一个真正的问题。

总而言之,《大数据时代:生活、工作与思维的大变革》这本书不仅让我对大数据有了系统了解,而且因为它,更是启迪我思考更多大数据的问题,思考到档案界对大数据的反应。作为档案人,我想呼吁人们都要理性地看待大数据,不要被响亮的口号所蒙蔽,特别是档案工作者,切不可因一叶障目而不见泰山。

大数据时代读后感 篇11

“大数据”一词的兴起似乎已有几年,原来对于大数据概念似懂非懂,一直以为“大数据”无非就是“大量的数据”或者就是“数据比较大”, 感觉与自身实际工作没有多大的联系,从来没有真正去了解大数据是什么,那么到底何谓“大数据”?我试着从百度查询了一下“大数据”一词概念:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

所谓大数据是由现代信息技术管理的大量数据的集合。从内容上讲,大数据是海量信息;从技术上讲,大数据是海量数据的采集、存储、分析、集成和控制。通过对大数据的了解,我认识到大数据技术与我们的生活和工作息息相关。

例如,你在逛**时**网页面跳出的感兴趣商品推荐是因为你曾经搜索该类商品,又如你购买了一套房子不久就会有装修公司打**询问是否需要装修等等,其实不知不觉中我们正处在一个大数据技术的时代。

最近公司组织大家阅读《大数据时代》这本书,又使我对“大数据”有了跟进一步的认识。《大数据时代》这本书作者舍恩伯格从大数据时代的思维变革、商业变革和管理变革三个角度依次阐述,条理清晰,书中运用了大量详实的实例分析使得阅读这本书变得通俗易懂。

第一部分“大数据时代的思维变革”,作者主要阐述三个观点:

1、 更多,不是随机样本,而是所有数据,样本=总体。

二、更杂,不是精确性,而是混杂性,允许不精确,纷繁的数据越多越好。

三、更好,不是因果关系,而是相关关系,关联物是**的关键。大数据与三大思维变化有关,它们相互关联、相互作用。首先,我们需要分析所有与某事相关的数据。其次,我们不依赖于分析少量的数据样本。

其次,我们愿意接受数据的复杂性。其次,我们不再是最准确的。最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。

第二部分,大数据业务转型强调数据不是数字化的,数据的多样性存在,任何文本、信息、通信和定位都可以数字化,关键是数据的挖掘、收集、集成和利用。大数据一旦得到有效利用,可以改变公司的赢利模式和沟通方式。大数据已经成为许多公司竞争力的**,它也将动摇这个国家的竞争力。

工业化国家应掌握数据和大数据技术,在全球竞争中占据优势,但随着大数据技术的普及,发达国家与发展中国家的差距将逐步缩小。

第三部分,大数据时代的管理变革,主要描述了大数据的威胁和数据时用的管理。对于普通人来说,隐私是大数据时代最重要的问题。不知不觉中,个人的每一个行为都暴露在**甚至是民营企业的面前,也面临着潜在的信息披露风险。

对此,笔者提出了用户责任的解决方案。大数据甚至可以**一个人的犯罪动机,这可以用来预防犯罪。

对烟草专卖管理工作大数据技术运用的感想

一,日常市场监管方面:通过对大量卷烟经营户相关信息的收集以及涉烟信息、线索和历史案件搜集汇总分析,构建起涉烟案件的大数据库,通过发现隐藏在数据背后的关联关系,形成新的烟草专卖管理防控网,查找违法活动的苗头趋势,有效提升专卖管理能力。

二、无证户监管方面:加强与公安、工商等部门协作和信息共享,有效利用现有无证经营户基础信息库,对无证经营户信息库数据进行汇总分析,实现与工商部门对无证户的精准打击,协同管理,有效规范卷烟市场经营秩序。

三、内管方面:通过对物流、营销、专卖等多部门现有数据及数据相关信息的收集、汇总,形成大数据库,运用大数据技术分析,提高专卖内管发现问题的效率,有效规范卷烟经营行为,促进行业持续健康发展。