-
深度解析 Flink 是如何管理好内存的?
所属栏目:[教程] 日期:2019-08-20 热度:87
前言 如今,许多用于分析大型数据集的开源系统都是用 Java 或者是基于 JVM 的编程语言实现的。最着名的例子是 Apache Hadoop,还有较新的框架,如 Apache Spark、Apache Drill、Apache Flink。基于 JVM 的数据分析引擎面临的一个常见挑战就是如何在内存中[详细]
-
面试系列:十个海量数据处理方法大总结
所属栏目:[教程] 日期:2019-08-20 热度:104
本文将简单总结下一些处理海量数据问题的常见方法。当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎讨[详细]
-
网络流量如何压测?
所属栏目:[教程] 日期:2019-08-20 热度:120
网络测试软件很多,今天就介绍2款大家常用的。分别为iptraf3和netperf 。网络测试关注的指标:PPS和内网带宽峰值。 iptraf 软件 yum-yinstallgccgcc-c++autoconfglibcglibc-develsysstatnload yuminstall-yiptraf3 (1) iptraf3 部分参数说明: (2) 查询带[详细]
-
影响TCP连接吞吐量的致命因素:HOL (干货)
所属栏目:[教程] 日期:2019-08-20 热度:51
一、什么是HOL HOL是Head of line blocking的意思,在互联网领域,包括HTTP head of line blocking和 TCP head of line blocking。 1. HTTP Head of line blocking Wikipedia对HTTP HOL的解释如下: 虽然HTTP/2解决了HTTP/1.1的HOL问题,但由于是建立在TCP[详细]
-
企业内部网中的IP地址规划方案,这6个点你必须掌握!
所属栏目:[教程] 日期:2019-08-19 热度:102
Intranet是 Internet技术在企业内部或闭合用户群内的实现,它的基本通信协议是TCP/IP协议,其中TCP使得内部网上的数据有序可靠地传输,IP 使内部网中的各个子网互联起来。 内部网中的每一台设备都是以IP地址标识网络位置的。 因此在组建内部网之前,要为网[详细]
-
5G改变社会?先要问问千行百业的利益群体答不答应
所属栏目:[教程] 日期:2019-08-19 热度:104
天下熙熙,皆为利来;天下攘攘,皆为利往,2000多年前司马迁在《史记货殖列传》中道出了市场经济核心规律。5G目前是社会热点,原信产部部长吴基传曾形象比喻5G现在比开水都热,喝的话烫嘴,但再火爆的热点落地时也必须符合市场规律。5G改变社会成为一个共识[详细]
-
穿越NAT的迷雾:深入理解网络地址转换和NAT穿透,以及STUN、TURN、ICE的关系
所属栏目:[教程] 日期:2019-08-19 热度:54
NAT是什么? NAT是Net Address Translation的缩写,即网络地址转换。 NAT部署在网络出口的位置,位于内网跟公网之间,是连接内网主机和公网的桥梁,双向流量都必须经过NAT,装有NAT软件的路由器叫NAT路由器,NAT路由器拥有公网IP。 你的家庭和办公网络环境[详细]
-
从全球大数据市场看未来发展趋势
所属栏目:[教程] 日期:2019-08-17 热度:132
近年来,全球大数据储量呈现爆炸式增长,其中中国数据产生量增长最为迅速,平均每年增长速度比全球快3%,预计到2025年中国将成为全球最大的数据圈。 中国数据圈将受到来自物联网设备信号、元数据、娱乐相关数据、云计算和边缘计算增长的驱动,中国生产力数[详细]
-
云数据管理会成为DataOps的未来吗?
所属栏目:[教程] 日期:2019-08-17 热度:114
如今,现代化的数据管理平台正在成为企业的首先,而传统的数据运维应用平台则逐渐被边缘化。尤其在AI和机器学习技术的推动下,企业数据正在走向以云为核心的数字化征程。 根据思科的一份数据显示:到2021年,企业4%的工作负载将托管在云数据中心。尽管很多[详细]
-
UDP协议-看这篇就够了
所属栏目:[教程] 日期:2019-08-17 热度:191
每一个程序员应该都知道TCP,UDP协议。UDP是用户数据报文协议,属于OSI模型中的传输层。它是一种无连接的协议,也就说上一报文和下一报文在协议层没有任何联系,同时提供了简单的不可靠的传输服务。 也就是说UDP是不可靠的,如果要想让数据可靠,就需要在业[详细]
-
身为网络工程师,你能说清楚网络的概念吗?
所属栏目:[教程] 日期:2019-08-17 热度:166
一、计算机网络的定义 定义:能够相互共享资源的方式互连起来的自治计算机系统的集合。 自治的计算机是指计算机之间没有明显的主从关系,一台计算机不能强制地启动、停止或者控制网络中的其他计算机。 计算机网络的基本特征:资源共享。资源主要包括硬件、[详细]
-
以太网数据传输原理是这样的,值得收藏
所属栏目:[教程] 日期:2019-08-17 热度:77
首先我们来回顾一下路由的基本概念,什么是路由?所谓路由就是当一台路由器(或其他三层设备)收到一个IP数据包时,路由器查看IP数据包的IP头部,将IP头部中的目的IP地址拿到路由表中进行查找,找到匹配的条目后,依照条目所指示的下一跳IP地址及出接口信息将[详细]
-
缺失数据别怕!这里有份强大的初学者指南
所属栏目:[教程] 日期:2019-08-17 热度:62
实际上,数据科学家80%到90%的工作是数据清理,而这项工作的目的是为了执行其余10%的机器学习任务。没有什么比完成数据集分析后的收获更让人兴奋的了。如何减少清理数据的时间?如何为至关重要的10%的工作保留精力? 根据很多专业人士的经验,对数据清理涉及[详细]
-
民生银行数据中台体系的构建与实践
所属栏目:[教程] 日期:2019-08-17 热度:197
在大数据、人工智能、区块链等新兴技术的驱动下,各家银行纷纷利用新技术制定数字转型改革战略,寻找差异化经营的可行模式。 民生银行积极推进改革转型,2018年在民营企业的银行、科技金融的银行、综合服务的银行战略指导下,民生银行从科技视角制定了技术[详细]
-
真正的大数据问题以及为什么只有机器学习才能解决它
所属栏目:[教程] 日期:2019-08-17 热度:172
为什么很多公司仍在努力构建从采集数据到获得洞察力的平稳运行的管道?他们希望投资和采用机器学习算法来分析数据,并做出商业预测。 但是,不可避免的是,他们应该意识到算法并不是魔法:如果采用的是垃圾数据,得出的就不会是一流的见解。因此,他们雇佣[详细]
-
聊一聊IPv4转IPv6隧道
所属栏目:[教程] 日期:2019-08-17 热度:161
什么情况下要用到IPv6隧道? 连上纯IPv6的网络,比如某些校园网PT站 用在服务器上面可以直接给你的服务器加AAAA记录,用纯IPv6的用户(比如国内的教育网)就可以直接访问你的服务器 内网穿透,别人可以直接用IPv6地址穿透到内网里面 教程 1、注册Tunnel Broke[详细]
-
大数据核心框架MapReduce过程解析
所属栏目:[教程] 日期:2019-08-15 热度:134
首先MapReduce很明显是分为Map阶段和Reduce阶段。两个阶段分别做什么呢? 小编自己画了个图,大家共勉一下 图中1-2过程为map过程,3为Reduce过程,接下来看一张专业图片,两张对比一起看 在整个mapReduce过程包含很多复杂的处理过程,而我们要学习的就是其[详细]
-
5G消息服务入口在哪,你可能想不到
所属栏目:[教程] 日期:2019-08-15 热度:69
自从今年6月6日工信部发放5G牌照以来,国内手机厂商、运营商都纷纷发布自家的5G产品。 7 月下旬,我们使用 5G 版的华为 Mate 20 X 在广州天河区首批 5G 商用试点区域的未来社里,曾录得 738Mbps 的网速,这大概是你手上那部 4G 手机的 15 倍。 从今年 2 月[详细]
-
企业可以不要大数据,但必须要有“数据中台”
所属栏目:[教程] 日期:2019-08-15 热度:86
2015年,马云拜访名为Supercell的芬兰游戏公司,虽然这家公司仅有180人,但是他们开发新游戏的速度特别快,公司旗下游戏DAU已经突破1亿。2016年,腾讯以86亿美元收购了其84%的股权,这不仅是腾讯历史上,也是近年全球手机游戏行业最大金额的并购。这家小公[详细]
-
极简操作!3分钟即可实现的 IIS 站点迁移
所属栏目:[教程] 日期:2019-08-15 热度:70
为实现负载平衡或者服务器迁移时,我们可能会使用多个 Web 服务器,也就会需要给多个 IIS配置同样的站点和应用程序池。根据需求一个一个重新建吗?当然不用!那得花费多少时间!我们只需要执行一些简单的命令即可在 IIS 上进行这些配置的导出导入~ 当我们在 I[详细]
-
TCP传输协议中如何解决丢包问题
所属栏目:[教程] 日期:2019-08-15 热度:140
一、回答这个问题之前,要考虑TCP协议为什么会丢包,在什么样的情况下会丢包。 1. TCP协议定义(Transimission Control Protocol)是以一种面向连接的、可靠的、基于字节流的传输层通信协议。 2. TCP是基于不可靠的网路实现可靠传输,肯定会存在丢包问题。 3[详细]
-
数据科学家与数据分析师的三个区别
所属栏目:[教程] 日期:2019-08-14 热度:177
近年来,很少有科技行业的工作像数据科学家这样受到如此热烈的追捧,随着越来越多的公司收集数据、分析数据以获得竞争优势,数据科学家被评为过去四年来美国最好的工作。 然而,数据科学家和另一个常见的大数据角色数据分析师之间的区别仍然不清晰。 数据[详细]
-
Iperf网络吞吐量/带宽测试的考虑和总结
所属栏目:[教程] 日期:2019-08-14 热度:65
Iperf测试:使用udp设定带宽2M,5M,10M,同时观察对正进行的ping测试的影响。证明iperf使用udp测试/使用一定或最大带宽时,同样能影响tcp协议的流量。 任务 (1) (使用UDP,参数-u -b 2M)设定不同带宽 #iperf3-c192.168.199.18-p54321-i1-t1800-u-b1M (2) 双[详细]
-
网络智能化有四误区
所属栏目:[教程] 日期:2019-08-14 热度:55
茶余饭后不聊个AI人工智能啥的都觉得自己不是社会人儿,可是对于网络智能化你真的了解吗?你的企业网络是自动化阶段还是智能化阶段,下面一些对于网络智能化的认知有以下误区: 以为工具智能化是网络智能 有人以为使用个智能化工具管理网络,网络就智能化了[详细]
-
不限量套餐被取消了?对5G而言到底意味着什么
所属栏目:[教程] 日期:2019-08-13 热度:128
据悉,中国电信宣布9月1日起停售达量限速套餐,中国移动和中国联通也表示会跟进,这也意味着三大运营商将取消不限量套餐,难道是为了给即将到来的5G时代做准备吗? 根据文件显示,9月1日起中国电信将全面停售达量限速版畅享及省内B类达量限速版套餐。具体而[详细]