hadoop ：java.lang.OutOfMemoryError: Java heap space

luo_yifan

浏览: 234516 次

最近访客更多访客>>

winder_sety

孚__夸

TERRY198411

linuxgao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

常常被一些用户问到，说“为什么我的mapreduce作业总是运行到某个阶段就报出如下错误，然后失败呢？以前同一个作业没出现过的呀？”

10/01/10 12:48:01 INFO mapred.JobClient: Task Id : attempt_201001061331_0002_m_000027_0, Status : FAILED 
java.lang.OutOfMemoryError: Java heap space 
        at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.<init>(MapTask.java:498) 
        at org.apache.hadoop.mapred.MapTask.run(MapTask.java:305) 
        at org.apache.hadoop.mapred.Child.main(Child.java:158)

这个实际上是 Out Of Memory OOM问题。

其实这样的错误有时候并不是程序逻辑的问题(当然有可能是由于程序写的不够高效，产生的内存消耗不合理而导致)，而是由于同样的作业，在数据量和数据本身发生不同时就会占据不同数量的内存空间。由于hadoop的mapreduce作业的运行机制是：在jobtracker接到客户端来的job提交后，将许多的task分配到集群中各个tasktracker上进行分块的计算，而根据代码中的逻辑可以看出，其实是在tasktracker上启了一个java进程进行运算，进程中有特定的端口和网络机制来保持map 和reduce之间的数据传输，所以，这些OOM的错误，其实就是这些java进程中报出了OOM的错误。
知道了原因以后就好办了，hadoop的mapreduce作业启动的时候，都会读取jobConf中的配置（hadoop-site.xml），只要在该配置文件中将每个task的jvm进程中的-Xmx所配置的java进程的max heap size加大，就能解决这样的问题：

<property> 
  <name>mapred.child.java.opts</name> 
  <value>-Xmx1024m</value> 
</property>

PS：该选项默认是200M
新版本应该是在conf/hadoop-env.sh文件中修改。默认为1000M

分享到：

nginx及apache不缓存配置； | linux下查看磁盘空间

2013-11-27 13:45
浏览 259
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop java.lang.UnsatisfiedLinkError: 解决方案：Exceptionin thread "main" java.lang.UnsatisfiedLinkError:org.apache.hadoop.util.NativeCrc32.nativeCo

[Hadoop权威指南(第2版)].(Hadoop：The.Definitive.Guide).文字版.pdf: [Hadoop权威指南(第2版)].(Hadoop：The.Definitive.Guide).Tom.White.文字版.pdf

java. lang . UnsatisfiedLinkError: org. apache . hadoop. io. nativeio. NativeIOSWindows . access0: hadoop. io. nativeio. NativeIOSWindows . access0 (Ijava/ lang/String;I)Z 原因：在调用NativeIO中的access0()时调不到解决方法：①第一步：在项目工程中加入NativelO.java，注意包名必须与源码中...

【SpringBoot 远程提交MapReduce】 Error: java.lang.ClassNotFoundException: xxxxx包.xxxxx类: 【SpringBoot】Error: java.lang.ClassNotFoundException: org.wltea.analyzer.core.IKSegmenter报错明细问题分析后记报错明细 IDEA SpringBoot集成hadoop运行环境，本地启动项目，GET请求接口触发远程提交...

FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeExcepti: FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 解决方法 ...

Hadoop：The.Definitive.Guide(3rd,Early.Release)]: [Hadoop：The.Definitive.Guide(3rd,Early.Release)].Tom.White.文字版.epub )

window 本地执行 hadoop 缺失的hadoop.dll 和 winutils.exe 文件: Exception in thread "main" java.lang.UnsatisfiedLinkError:''boolean org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(java.lang.String, int)' * at org.apache.hadoop.io.nativeio.NativeIO$...

hadoop2.7.3 hadoop.dll: org.apache.hadoop.io.nativeio.NativeIO$Windows.createDirectoryWithMode0(Ljava/lang/String;I)V 解决方案：下载本资源解压将hadoop.dll和winutils.exe文件复制到hadoop2.7.3的bin目录下即可解决。

解决Hive启动失败Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient: FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 通过控制台的...

org.apache.hadoop.ipc.Client: Retrying connect to server: NULL 博文链接：https://ouyida3.iteye.com/blog/1144326

hadoop-2.7.3.tar.gz 下载 hadoop tar 包下载: hadoop-2.7.3.tar.gz 下载目前相对比较稳定的版本 hadoop tar 包下载hadoop-2.7.3.tar.gz 下载 hadoop tar 包下载

大数据hadoop winutils.exe: 支持windows开发hadoop的连接,解决报警Did not find winutils.exe: java.io.FileNotFoundException

win32win64hadoop2.7.x.hadoop.dll.bin: 32位和64位的windows系统 hadoop部署要用文件，有2个压缩包，目前在win7 32位平台，hadoop2.7.5亲测可用。

hadoop-2.6.0-hadoop.dll-winutils.exe: at org.apache.hadoop.util.Shell.runCommand(Shell.java:482) at org.apache.hadoop.util.Shell.run(Shell.java:455) at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:715) at ...

flink依赖jar包——解决NoClassDefFoundError: com/sun/jersey: at org.apache.hadoop.yarn.client.api.TimelineClient.createTimelineClient(TimelineClient.java:45) at org.apache.hadoop.yarn.client.api.impl.YarnClientImpl.serviceInit(YarnClientImpl.java:163) at org...

hadoop的winutils.exe及hadoop.dll文件: 我的报错：Could not locate Hadoop executable: E:\big_data\hadoop-3.3.0\bin\winutils.ex hadoop的winutils.exe及hadoop.dll文件,可以用于hadoop3.3. 下载好直接将两个文件复制到我们hadoop的bin目录下就行了

avro-mapred-1.7.8-SNAPSHOT-hadoop2: org.apache.hadoop.mapred.YarnChild: Error running child : java.lang.IncompatibleClassChangeError: Found interface org.apache.hadoop.mapreduce.TaskAttemptContext, but class was expected at org.apache...

【kettle集成cdh6.1】hadoop file output浏览目录报错：java.lang.NoClassDefFoundError: com/ctc/wstx/io/SystemId: 【kettle集成cdh6.1】外部数据源读写hdfs若干...在此之前，我已经从CDH HDFS管理页面将所需要的core-site.xml、hdfs-site.xml等文件下载并放置至相应的插件位置，又从HADOOP在里将hadoop-client-3.0.0-cdh6.1.0.jar、h

hadoop.dll: at org.apache.hadoop.util.Shell.runCommand(Shell.java:482) 2：window10操作系统下面。hadoop-2.6.4版本，解决上面这个问题的必须两个文件。详细见博客：http://www.cnblogs.com/biehongli/p/7895857.html 3：...

Linux常用的操作命令+hadoop安装指导.docx: 大数据课程自备资料：Hadoop安装指南 + Linux常用操作命令

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论