百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

docker从入门到实战系列5-dockerfile定制镜像

nanshan 2024-12-28 14:30 14 浏览 0 评论

前言

上一篇介绍了如何使用docker命令一键搭建Gitlab、Jenkins等各类测试环境,Jenkins等镜像大多是镜像仓库中别人制作好上传上去的,我们在运行容器时docker pull下来使用。本篇则重点介绍dockerfile构建镜像原理以及如何使用dockerfile定制属于我们自己的镜像,从而灵活地创建各类容器,实现一些预置的功能。

一、Dockerfile是什么?

1.Dockerfile简介

Dockerfile 是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令(Instruction)和说明。每一条指令构建一层,因此每一条指令的内容,就是描述该层应当如何构建。

镜像的定制实际上就是定制每一层所添加的配置文件。如果我们可以把每一层修改、安装、构建、操作的命令都写入一个脚本,用这个脚本来构建、定制镜像,那么镜像构建透明性的问题、体积的问题就都会解决。这个脚本就是Dockerfile。

2.Dockerfile作用

Dockerfile的作用:定制镜像,所谓定制镜像,就是以一个镜像为基础,在其上进行定制,丰富功能、提前作一些配置等。

有了Dockerfile,当我们需要定制自己额外的需求时,只需在Dockerfile上添加或者修改指令,重新生成image即可,省去了来回敲命令的麻烦。

3.Dockerfile结构

Dockerfile结构大致分为四个部分:基础镜像信息、维护者信息、镜像操作指令和容器启动时执行指令。Dockerfile每行支持一条指令,每条指令可携带多个参数,支持使用以“#“号开头的注释。

二、Dockerfile构建镜像原理

https://docs.docker.com/develop/develop-images/dockerfile_best-practices/

1.Linux文件系统

在学习docker镜像原理前,先来看一下Linux文件系统原理:

Linux文件系统由bootfs和rootfs两部分组成

  • bootfs:包含bootloader(引导加载程序)和 kernel(内核)
  • rootfs:root文件系统,包含的就是典型 Linux 系统中的/dev、/proc、/bin、/etc等标准目录和文件
  • 不同的linux发行版,bootfs基本一样,而rootfs不同,如ubuntu,centos等。

2.Docker镜像原理

Docker镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数 (如匿名卷、环境变量、用户等)。镜像不包含任何动态数据,其内容在构建之后也不会被改变。

  • Docker镜像是由特殊的文件系统叠加而成,最底端是bootfs,并使用宿主机的bootfs
  • 第二层是root文件系统rootfs,称为base image
  • 然后再往上可以叠加其他的镜像文件
  • 统一文件系统技术能够将不同的层级整合成一个文件系统,并为这些层级提供一个统一的视角,这样就隐藏了多个层级的存在,在用户的角度看来,只存在一个文件系统
  • 一个镜像可以叠加在另一个镜像的上面,位于下层的镜像称为父镜像,最底部的镜像称为基础镜像
  • 当从一个镜像启动容器时,docker会在最顶层加载一个读写文件系统作为容器

所以,docker镜像其实是一个分层文件系统。之所以docker的CentOS镜像只有200多兆、而CentOS系统的ISO却有几个G,就是因为docker的CentOS镜像使用了宿主机的bootfs,其自身只有rootfs和其他镜像层。

3.Dockerfile构建镜像原则

dockerfile构建镜像需要遵循以下原则:

  • 单一职责:每个层级只做每个层级的事
  • 提供注释信息:最好提供注释信息,以便他人理解
  • 保持容器最小化
  • 合理选择基础镜像:基础镜像的选择很重要,尽量选择成熟易用的基础镜像版本
  • 最小化镜像层数:镜像层数不宜过多,尽量精简,否则容易出错,也可能会影响加载速度

通过上面的示例图也能够看出,每多一行命令,镜像的内容就会多一层。

三、Dockerfile常用指令

1.常用指令释义

指令

说明

FROM

指定基础镜像

MAINTAINER

增加说明信息,如维护者姓名邮箱等,非必须

RUN

执行具体的linux命令(用于构建镜像时执行相关的命令)

USER

基于哪个用户运行容器

ADD

将本地的文件添加到镜像内(支持正则表达式拷贝,支持更多的文件类型的拷贝,如网络文件的下载后拷贝,ADD http://xxxx/test.tar.gz /test/)

COPY

将本地文件拷贝到镜像内(只支持基本的文件、文件夹的拷贝,推荐使用COPY),最好将要拷贝的文件置于Dockerfile同一目录下

WORKDIR

目录切换指令,类似于linux的cd命令WORKDIR /home/jenkins_home/conf 等同于以下指令:

  • WORKDIR /home
  • WORKDIR jenkins_home/conf

EXPOSE

指定容器监听的端口,仅作为说明,不会真正生效,还是需要使用docker run -p参数进行端口映射

CMD

类似于RUN指令,区别与CMD是在启动容器时执行相关的命令,CMD echo "hello world" 或 ['ECHO','hello world']都可以,推荐使用后者列表形式

ENTRYPOINT

设定容器启动时第一个运行的命令及其参数。两种格式:

exec格式(数值格式):ENTRYPOINT ["要运行的程序","参数1","参数2"]
shell格式:ENTRYPOINT 命令 选项 参数

指定ENTRYPOINT参数后,使用docker run xxxx 启动容器时,docker run 后面的参数不会被覆盖

ENV

指定运行容器时的环境变量,格式为 KEY=VALUE或KEY VALUE,如ENV VERSION=2.0在后续指令中可以使用$VERSION进行替换2.0

VOLUME

数据栈声明,做匿名挂载用,假设指令为VOLUME /usr/local,则在启动容器后会在服务器上docker默认路径/var/lib/docker/volumes/下自动生成一个文件夹,用于挂载/usr/local,常用于执行docker run命令时忘记指定-v 参数,从而自动保存一些重要的数据时使用

2.'CMD'、'ENTRPOINT'、'docker run xxx' 三者之间的区别与联系

  • 若指定了CMD ['ECHO','hello world'],同时使用了docker run -p 8080:80 xxx,则docker run 后面的参数会覆盖CMD后面的指令;
  • 若指定了ENTRYPOINT ['nginx'],同时使用了docker run -p 8080:80 xxx,则会把docker run 后面的参数作为参数传递给ENTRYPOINT,与ENTRYPOINT后面的参数拼接起来;
  • 若CMD ['ECHO','hello world'],同时指定了ENTRYPOINT ['nginx'],则会把CMD后的参数作为参数传递给ENTRYPOINT,与ENTRYPOINT后面的参数拼接起来;

总结:CMD相对更为灵活,用户可以通过docker run 更改dockerfile中CMD的指令,而ENTRYPOINT则更为单一,使用docker run命令行参数启动容器时无法修改dockerfile中ENTRYPOINT的指令;

3.Dockerfile示例

自定义Dockerfile

如下,我们制作一个简单的Dockerfile用来构建镜像,它是基于centos7镜像。其中,执行一些简单的命令,如输出信息、创建文件夹,另外提前添加文件到镜像目录、切换目录,最后安装一个工具,执行查看网卡命令:

# 基于centos7镜像
FROM centos:7

# 维护者信息
MAINTAINER "chenjigang"

# 基于root用户运行容器
USER root

# 运行命令
RUN echo "test dockerfile..."
RUN mkdir -p /home/docker_home

# 本地复制文件到镜像内
COPY docker_install.sh /home/docker_home/docker_install.sh

# 切换目录
WORKDIR /home/docker_home
RUN ls -al

RUN yum install -y net-tools
RUN ifconfig

mysql示例

下图是MySQL的官方镜像的dockerfile,其实也就是用到了上面介绍的各个命令,将其有机地结合,例如:一开始会添加一个文件>>然后运行bash>>创建用户和用户组>>中间设置环境>>设置数据目录>>最后启动mysqld,从而实现MySQL的构建:

四、从Dockerfile构建镜像

Dockerfile 创建完成后,可以使用 docker build 命令根据 Dockerfile 构建一个镜像。Docker build常用的指令包括两个参数:

  • -t 指定镜像的名字
  • -f 显示指定构建镜像的 Dockerfile 文件,若当前操作目录与Dockerfile文件处于同一目录,则使用.也可以,否则需使用 -f 参数指定Dockerfile文件路径(注:Dockerfile 命名为非固定命名,可更改)

基于上面第一个Dockerfile提交构建:

# 运行当前目录下的Dockerfile文件,生成一个名为mycentos7的镜像
docker build -t mycentos7 .

如下图所示,运行docker build构建镜像命令后,正在按照上述自定义的Dockerfile中的步骤顺序执行:

从下图可以看出,已经成功构建了一个镜像:mycentos7:latest

查看镜像列表,存在新构建的镜像mycentos7:

基于mycentos7镜像创建一个容器:

docker run -it --name mycentos7 mycentos7:latest sh

此时,启动容器,进入镜像shell环境内会发现Dockerfile文件中定义的命令已生效:

  • 指定的docker_install.sh已复制到mycentos镜像的/home/docker_home文件夹下;
  • net-tools工具已提前安装成功,"ifconfig"命令可以正常执行;

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: