本文适用于CentOS 6.4,CentOS 6.5,估计也适用于其他Linux发行版。
1. 准备工作
确认内核及版本信息
[root@hostname~]#uname-r2.6.32-220.el6.x86_64 [root@hostname~]#cat/etc/centos-releaseCentOSrelease6.5(Final)
安装软件
编译安装新内核,依赖于开发环境和开发库
#yumgrouplist//查看已经安装的和未安装的软件包组,来判断我们是否安装了相应的开发环境和开发库;#yumgroupinstall"DevelopmentTools"//一般是安装这两个软件包组,这样做会确定你拥有编译时所需的一切工具#yuminstallncurses-devel//你必须这样才能让make*config这个指令正确地执行#yuminstallqt-devel//如果你没有X环境,这一条可以不用#yuminstallhmaccalczlib-develbinutils-develelfutils-libelf-devel//创建CentOS-6内核时需要它们
如果当初安装系统是选择了Software workstation,上面的安装包几乎都已包含。
2. 编译内核
获取并解压内核源码,配置编译项
Linux内核版本有两种:稳定版和开发版 ,Linux内核版本号由3个数字组成:r.x.y
去http://www.kernel.org首页,可以看到有stable,longterm等版本,longterm是比stable更稳定的版本,会长时间更新,因此我选择 3.10.58。
[root@sean~]#wgethttps://www.kernel.org/pub/linux/kernel/v3.x/linux-3.10.28.tar.xz
[root@sean~]#tar-xflinux-3.10.58.tar.xz-C/usr/src/[root@sean~]#cd/usr/src/linux-3.10.58/[root@seanlinux-3.10.58]#cp/boot/config-2.6.32-220.el6.x86_64.config
我们在系统原有的内核配置文件的基础上建立新的编译选项,所以复制一份到当前目录下,命名为.config。接下来继续配置:
[root@seanlinux-3.10.58]#sh-c'yes""|makeoldconfig' HOSTCCscripts/basic/fixdepHOSTCCscripts/kconfig/conf.oSHIPPEDscripts/kconfig/zconf.tab.cSHIPPEDscripts/kconfig/zconf.lex.cSHIPPEDscripts/kconfig/zconf.hash.cHOSTCCscripts/kconfig/zconf.tab.oHOSTLDscripts/kconfig/conf scripts/kconfig/conf--oldconfigKconfig.config:555:warning:symbolvalue'm'invalidforPCCARD_NONSTATIC.config:2567:warning:symbolvalue'm'invalidforMFD_WM8400.config:2568:warning:symbolvalue'm'invalidforMFD_WM831X.config:2569:warning:symbolvalue'm'invalidforMFD_WM8350.config:2582:warning:symbolvalue'm'invalidforMFD_WM8350_I2C.config:2584:warning:symbolvalue'm'invalidforAB3100_CORE.config:3502:warning:symbolvalue'm'invalidforMMC_RICOH_MMC* *Restartconfig... * * *Generalsetup * ......XZdecompressortester(XZ_DEC_TEST)[N/m/y/?](NEW) Averagingfunctions(AVERAGE)[Y/?](NEW)yCORDICalgorithm(CORDIC)[N/m/y/?](NEW) JEDECDDRdata(DDR)[N/y/?](NEW) ##configurationwrittento.config
make oldconfig
会读取当前目录下的.config
文件,在.config
文件里没有找到的选项则提示用户填写,然后备份.config
文件为.config.old
,并生成新的.config
文件,参考http://stackoverflow.com/questions/4178526/what-does-make-oldconfig-do-exactly-linux-kernel-makefile
有的文档里介绍使用make memuconfig,它便是根据需要定制模块,类似界面如下:(在此不需要)
开始编译
[root@seanlinux-3.10.58]#make-j4bzImage//生成内核文件[root@seanlinux-3.10.58]#make-j4modules//编译模块[root@seanlinux-3.10.58]#make-j4modules_install//编译安装模块
-j后面的数字是线程数,用于加快编译速度,一般的经验是,逻辑cpu,就填写那个数字,例如有8核,则为-j8。(modules部分耗时30多分钟)
安装
[root@seanlinux-3.10.58]# make install
实际运行到这一步时,出现ERROR: modinfo: could not find module vmware_balloon
,但是不影响内核安装,是由于vsphere需要的模块没有编译,要避免这个问题,需要在make之前时修改.config文件,加入
HYPERVISOR_GUEST=yCONFIG_VMWARE_BALLOON=m
(这一部分比较容易出问题,参考下文异常部分)
修改grub引导,重启
安装完成后,需要修改Grub引导顺序,让新安装的内核作为默认内核。
编辑 grub.conf文件,
vi/etc/grub.conf#boot=/dev/sdadefault=0timeout=5splashimage=(hd0,0)/grub/splash.xpm.gz hiddenmenu titleCentOS(3.10.58) root(hd0,0) ...
数一下刚刚新安装的内核在哪个位置,从0开始,然后设置default为那个数字,一般新安装的内核在第一个位置,所以设置default=0。
重启reboot
:
确认当内核版本
[root@sean~]#uname-r3.10.58
升级内核成功!
3. 异常
编译失败(如缺少依赖包)
可以先清除,再重新编译:
#makemrproper#完成或者安装过程出错,可以清理上次编译的现场#makeclean
在vmware虚拟机上编译,出现类似下面的错误
[root@seanlinux-3.10.58]#makeinstallsh/usr/src/linux-3.10.58/arch/x86/boot/install.sh3.10.58arch/x86/boot/bzImage\System.map"/boot"ERROR:modinfo:couldnotfindmodulevmware_balloon
可以忽略,如果你有强迫症的话,尝试以下办法:
要在vmware上需要安装VMWARE_BALLOON,可直接修改.config文件,但如果vi直接加入CONFIG_VMWARE_BALLOON=m
依然是没有效果的,因为它依赖于HYPERVISOR_GUEST=y
。如果你不知道这层依赖关系,通过make menuconfig
后,Device Drivers -> MISC devices 下是找不到VMware Balloon Driver的。(手动vi .config修改HYPERVISOR_GUEST后,便可以找到这一项),另外,无论是通过make menuconfig或直接vi .config,最后都要运行sh -c 'yes "" | make oldconfig'
一次得到最终的编译配置选项。
然后,考虑到vmware_balloon可能在这个版本里已更名为vmw_balloon,通过下面的方法保险起见:
#cd/lib/modules/3.10.58/kernel/drivers/misc/#ln-svmw_balloon.kovmware_balloon.ko#建立软连接
其实,针对安装Docker的内核编译环境,最明智的选择是使用sciurus帮我们配置好的.config文件。
也建议在make bzImage
之前,运行脚本check-config.sh检查当前内核运行docker所缺失的模块。
当提示缺少其他module时如NF_NAT_IPV4时,也可以通过上面的方法解决,然后重新编译。
4. 几个重要的Linux内核文件介绍
在网络中,不少服务器采用的是Linux系统。为了进一步提高服务器的性能,可能需要根据特定的硬件及需求重新编译Linux内核。编译Linux内核,需要根据规定的步骤进行,编译内核过程中涉及到几个重要的文件。比如对于RedHat Linux,在/boot目录下有一些与Linux内核有关的文件,进入/boot执行:ls �l。编译过RedHat Linux内核的人对其中的System.map 、vmlinuz、initrd-2.4.7-10.img印象可能比较深刻,因为编译内核过程中涉及到这些文件的建立等操作。那么这几个文件是怎么产生的?又有什么作用呢?
(1)vmlinuz
vmlinuz是可引导的、压缩的内核。“vm”代表“Virtual Memory”。Linux 支持虚拟内存,不像老的操作系统比如DOS有640KB内存的限制。Linux能够使用硬盘空间作为虚拟内存,因此得名“vm”。vmlinuz是可执行的Linux内核,它位于/boot/vmlinuz,它一般是一个软链接。
vmlinuz的建立有两种方式。
一是编译内核时通过“make zImage”创建,然后通过:“cp /usr/src/linux-2.4/arch/i386/linux/boot/zImage /boot/vmlinuz”产生。zImage适用于小内核的情况,它的存在是为了向后的兼容性。
二是内核编译时通过命令make bzImage创建,然后通过:“cp /usr/src/linux-2.4/arch/i386/linux/boot/bzImage /boot/vmlinuz”产生。
bzImage是压缩的内核映像,需要注意,bzImage不是用bzip2压缩的,bzImage中的bz容易引起误解,bz表示“big zImage”。 bzImage中的b是“big”意思。
zImage(vmlinuz)和bzImage(vmlinuz)都是用gzip压缩的。它们不仅是一个压缩文件,而且在这两个文件的开头部分内嵌有gzip解压缩代码。所以你不能用gunzip 或 gzip �dc解包vmlinuz。
内核文件中包含一个微型的gzip用于解压缩内核并引导它。两者的不同之处在于,老的zImage解压缩内核到低端内存(第一个640K),bzImage解压缩内核到高端内存(1M以上)。如果内核比较小,那么可以采用zImage 或bzImage之一,两种方式引导的系统运行时是相同的。大的内核采用bzImage,不能采用zImage。
vmlinux是未压缩的内核,vmlinuz是vmlinux的压缩文件。
(2)initrd-x.x.x.img
initrd是“initial ramdisk”的简写。initrd一般被用来临时的引导硬件到实际内核vmlinuz能够接管并继续引导的状态。比如,使用的是scsi硬盘,而内核vmlinuz中并没有这个scsi硬件的驱动,那么在装入scsi模块之前,内核不能加载根文件系统,但scsi模块存储在根文件系统的/lib/modules下。为了解决这个问题,可以引导一个能够读实际内核的initrd内核并用initrd修正scsi引导问题。initrd-2.4.7-10.img是用gzip压缩的文件,下面来看一看这个文件的内容。
initrd实现加载一些模块和安装文件系统等。
initrd映象文件是使用mkinitrd创建的。mkinitrd实用程序能够创建initrd映象文件。这个命令是RedHat专有的。其它Linux发行版或许有相应的命令。这是个很方便的实用程序。具体情况请看帮助:man mkinitrd
下面的命令创建initrd映象文件:
(3)System.map
System.map是一个特定内核的内核符号表。它是你当前运行的内核的System.map的链接。
内核符号表是怎么创建的呢? System.map是由“nm vmlinux”产生并且不相关的符号被滤出。对于本文中的例子,编译内核时,System.map创建在/usr/src/linux-2.4/System.map。像下面这样:
nm /boot/vmlinux-2.4.7-10 > System.map
下面几行来自/usr/src/linux-2.4/Makefile:
nm vmlinux | grep -v '(compiled)|(.o
)|([aUw])|(..ng
)|(LASH[RL]DI)' | sort > System.map
然后复制到/boot:
cp /usr/src/linux/System.map /boot/System.map-2.4.7-10
在进行程序设计时,会命名一些变量名或函数名之类的符号。Linux内核是一个很复杂的代码块,有许许多多的全局符号。
Linux内核不使用符号名,而是通过变量或函数的地址来识别变量或函数名。比如不是使用size_t BytesRead这样的符号,而是像c0343f20这样引用这个变量。
对于使用计算机的人来说,更喜欢使用那些像size_t BytesRead这样的名字,而不喜欢像c0343f20这样的名字。内核主要是用c写的,所以编译器/连接器允许我们编码时使用符号名,当内核运行时使用地址。
然而,在有的情况下,我们需要知道符号的地址,或者需要知道地址对应的符号。这由符号表来完成,符号表是所有符号连同它们的地址的列表。Linux 符号表使用到2个文件:/proc/ksyms和System.map。
/proc/ksyms是一个“proc file”,在内核引导时创建。实际上,它并不真正的是一个文件,它只不过是内核数据的表示,却给人们是一个磁盘文件的假象,这从它的文件大小是0可以看出来。然而,System.map是存在于你的文件系统上的实际文件。当你编译一个新内核时,各个符号名的地址要发生变化,你的老的System.map具有的是错误的符号信息。每次内核编译时产生一个新的System.map,你应当用新的System.map来取代老的System.map。
虽然内核本身并不真正使用System.map,但其它程序比如klogd, lsof和ps等软件需要一个正确的System.map。如果你使用错误的或没有System.map,klogd的输出将是不可靠的,这对于排除程序故障会带来困难。没有System.map,你可能会面临一些令人烦恼的提示信息。
另外少数驱动需要System.map来解析符号,没有为你当前运行的特定内核创建的System.map它们就不能正常工作。
Linux的内核日志守护进程klogd为了执行名称-地址解析,klogd需要使用System.map。System.map应当放在使用它的软件能够找到它的地方。执行:man klogd可知,如果没有将System.map作为一个变量的位置给klogd,那么它将按照下面的顺序,在三个地方查找System.map:
/boot/System.map
/System.map
/usr/src/linux/System.map
System.map也有版本信息,klogd能够智能地查找正确的映象(map)文件。