Python 构建气流图像时，诗歌和 buildkit mount=type=cache 不起作用

发布于09月09日

我有2个停靠文件的例子，一个是工作的，另一个是不工作的.两者之间的主要区别是基本图像.

简单的基于python的图像docker文件:

# syntax = docker/dockerfile:experimental
FROM python:3.9-slim-bullseye

RUN apt-get update -qy && apt-get install -qy \
    build-essential tini libsasl2-dev libssl-dev default-libmysqlclient-dev gnutls-bin

RUN pip install poetry==1.1.15
COPY pyproject.toml .
COPY poetry.lock .
RUN poetry config virtualenvs.create false
RUN --mount=type=cache,mode=0777,target=/root/.cache/pypoetry poetry install

Airflow基础图像扩展底座文件:

# syntax = docker/dockerfile:experimental
FROM apache/airflow:2.3.3-python3.9
USER root
RUN apt-get update -qy && apt-get install -qy \
    build-essential tini libsasl2-dev libssl-dev default-libmysqlclient-dev gnutls-bin

USER airflow
RUN pip install poetry==1.1.15
COPY pyproject.toml .
COPY poetry.lock .
RUN poetry config virtualenvs.create false
RUN poetry config cache-dir /opt/airflow/.cache/pypoetry
RUN --mount=type=cache,uid=50000,mode=0777,target=/opt/airflow/.cache/pypoetry poetry install

在构建docker文件之前，在与pyproject.toml文件相同的文件夹中运行poetry lock！

pyproject.toml个文件:pyproject.toml个文件:

[tool.poetry]
name = "Airflow-test"
version = "0.1.0"
description = ""
authors = ["Lorem ipsum"]

[tool.poetry.dependencies]
python = "~3.9"
apache-airflow = { version = "2.3.3", extras = ["amazon", "crypto", "celery", "postgres", "hive", "jdbc", "mysql", "ssh", "slack", "statsd"] }
prometheus_client = "^0.8.0"
isodate = "0.6.1"
dacite = "1.6.0"
sqlparse = "^0.3.1"
python3-openid = "^3.1.0"
flask-appbuilder = ">=3.4.3"
alembic = ">=1.7.7"
apache-airflow-providers-google = "^8.1.0"
apache-airflow-providers-databricks = "^3.0.0"
apache-airflow-providers-amazon = "^4.0.0"
pendulum = "^2.1.2"

[tool.poetry.dev-dependencies]

[build-system]
requires = ["poetry-core>=1.0.0"]
build-backend = "poetry.core.masonry.api"

为了构建映像，这是我使用的命令:

DOCKER_BUILDKIT=1 docker build --progress=plain -t airflow-test -f Dockerfile .

对于这两个映像，它们第一次构建时，poetry install将需要下载所有依赖项.有趣的是，在我第二次构建该映像时，由于依赖项已被缓存，因此基于Python的映像速度要快得多，但基于Airflow的映像将再次try 下载所有200个依赖项. 根据O通过指定--mount=type=cache了解到的情况，该目录将存储在映像存储库中，以便下次构建映像时可以重用.通过此操作可以修剪最终图像的大小.

在运行映像时，依赖关系是如何显示的？如果我运行docker run -it --user 50000 --entrypoint /bin/bash image，一个简单的Python导入将在气流图像上工作，但不会在Python图像上工作.何时以及如何将依赖项重新附加到映像？

如果你想试一试，这里有一个虚拟项目，可以在本地克隆并玩耍: https://github.com/ioangrozea/Docker-dummy个

Python 构建气流图像时，诗歌和 buildkit mount=type=cache 不起作用

推荐答案

Python相关问答推荐

Tkinter滑动条标签.我不确定如何删除滑动块标签或更改其文本

实现的差异取决于计算出的表达是直接返回还是首先存储在变量中然后返回

如何使用stride_tricks.as_strided逆转NumPy数组

列表上值总和最多为K(以O(log n))的最大元素数

提取两行之间的标题的常规表达

如何在BeautifulSoup中链接Find()方法并处理无？

使用FASTCGI在IIS上运行Django频道

如何删除索引过go 的lexsort深度可能会影响性能？' &>

运行Python脚本时，用作命令行参数的SON文本

无法通过python-jira访问jira工作日志(log)中的 comments

如何记录脚本输出

如何使用Python以编程方式判断和检索Angular网站的动态内容？

从Windows Python脚本在WSL上运行Linux应用程序

在极中解析带有数字和SI前缀的字符串

(Python/Pandas)基于列中非缺失值的子集DataFrame

如何按row_id/row_number过滤数据帧

你能把函数的返回类型用作其他地方的类型吗？'

ModuleNotFoundError：Python中没有名为google的模块''

Django.core.exceptions.SynchronousOnlyOperation您不能从异步上下文中调用它-请使用线程或SYNC_TO_ASYNC

如何在Python中从html页面中提取html链接？