一.快速安装入门

1.docker
2.kubernetes
3.为kubectl配置别名和命令行补全
 4.卸载k8s
5.K3s – a lightweight Kubernetes
6.资源的清理工作及删除k3s

二.k8s Notes

1.kubernetes配置文件

2.k8s相关问题修复

2.1etcd connection refuse问题修复
2.2node:no resource found问题修复

一.快速安装入门

1.docker

sudo yum update
sudo yum list docker
sudo yum install docker
sudo systemctl enable docker.service
sudo sytemctl start docker.service
sudo systemctl status docker.service
sudo usermod -aG docker ${USER}
注意：如果更改了已登陆系统账户所属的用户组，该用户必须退出系统后在登陆，组关系的更改才能生效
rpm -ql docker | less

Notes:
首先在一个终端中运行：journalctl -f -u docker

打开另一个终端运行docker的相关命令：
docker search | pull | run <registy>/<repository>/<image>:<tag>
注意区别registry和repository：例如对于docker hub registry来说repository应为你的DockerHubID
registry：早期中所有系统中的registry都为Docker Hub Registry(docker.io)，但由于大企业连接公共registry的风险问题，RHEL以将默认的Docker Hub Registry改为了registry.access.redhat.com，我在ubuntu中并为找到相关可以自己修改的registry项，在fedora中应可以找到，下面就来找一下。

首先找出Docker的相关配置文件：
sudo find /etc -name docker

在这里插入图片描述
ls -alF /etc/sysconfig/docker
ls -alF /etc/docker
可以看出相关的配置应该在/etc/sysconfig/docker文件中
less /etc/sysconfig/docker
由标注处可以看出原本可以在该文件中设置的registry改为了在/etc/containers/registries.conf中进行设置
man 5 registries.conf:可查看联机帮助页
less /etc/containers/registries.conf
在这里插入图片描述

[registries.search]
registries = ['docker.io', 'registry.fedoraproject.org', 'quay.io', 'registry.access.redhat.com', 'registry.centos.org']

可以看出fedora中的第一个查找的registry为docker.io即Docker Hub Registry，但其后又有多个按顺序查找的registry，其中就有RHEL的，还有fedora项目自身的以及centos的registry。

2.kubernetes

sudo yum update
yum list kubernetes
sudo yum install -y --enablerepo=updates-testing kubernetes etcd
若你安装的k8s集群不稳定，去掉–enablerepo项
sudo systemctl stop firewalld
sudo systemctl disable firewalld
修改/etc/kubernetes/apiserver文件：去掉ACL中的ServiceAccount项
MSERVICES="etcd kube-apiserver kube-controller-manager kube-scheduler"
sudo systemctl restart $MSERVICES
sudo systemctl enable $MSERVICES
sudo systemctl is-active $MSERVICES
sudo systemctl is-enabled $MSERVICES
NSERVICES="kube-proxy kubelet docker"
sudo systemctl restart $NSERVICES
sudo systemctl enable $NSERVICES
sudo systemctl is-active $NSERVICES
sudo systemctl is-enabled $NSERVICES
kubectl cluster-info
kubectl get node
kubectl describe node 127.0.0.1

Notes
找出k8s的相关配置文件，自行查看
在这里插入图片描述

3.为kubectl配置别名和命令行补全

~~docker内置了命令行补全功能，而k8s需要我们自己配置才可以使用命令行补全功能。~~

创建别名
你可以一直使用kubectl可执行文件的全名（可以使用type命令查看kubectl的可执行文件：type kubectl）
在这里插入图片描述

但是你可以利用linux中的别名特性，为kubectl添加一个较短的别名，如k，这样就不用每次都输入kubectl了。
编辑~/.bashrc文件，添加如下内容：
alias k=kubectl
在这里插入图片描述
编辑完成后保存退出，在terminal中运行alias k命令，查看你添加的别名是否生效。注意：若你在编辑bashrc文件前已经打开了一个terminal，请在打开一个新的terminal运行上述命令才能看到生效的改动。

为kubectl配置tab补全

kubectl可以配置bash和zsh shell的代码补全。
tab不仅可以补全命令名，还能补全对象名。
首先运行：kubectl<Tab><Tab><Tab>
可以查看到kubectl的所有可用命令
在这里插入图片描述看到其中的completion命令，该命令即为kebectl的命令行自动补全的脚本文件，也可以利用：kubectl completion bash | less查看该脚本文家的内容。

原本：~~docker内置了命令行补全功能，而k8s需要我们自己配置才可以使用命令行补全功能。~~ ，但是现在看来最新版的Fedora中已经内置了k8s的kubectl命令行tab补全功能，而当初在centos中是需要我们自己下载这个名为bashcompletion的包来启用bash中的tab命令行补全功能。

那么既然如此如果你使用的是centos且用的是配置国内k8s的yum源的方式，你可以使用如下方法来启用k8s的kubectl命令行tab补全功能：

首先安装bashcompletion包
yum updates
yum list bashcompletion
如果显示了相关的包，安装该包即可，如果没有显示，证明你的/etc/yum.repos.d中搜索不到该包，那么你就可以放弃下面的操作了，你需要运行：kubectl bashcompletion -h自己查看相关安装说明。
如果你的系统中不可以运行上述命令，那么你需要自己查看一下你到底能否安装，下面是官网的相关说明：
Detailed instructions on how to do this are available here: https://kubernetes.io/docs/tasks/tools/install-kubectl/#enabling-shell-autocompletion
搜索到该包的，进行包的安装：
yum install -y bashcompletion
然后运行：source < (kubectl completion bash)
注意：若想让上述命令永久有效，需将上述命令添加到/etc/profile或是$HOME/.bash_profile或是$HOME/.bashrc文件中。
我将上述命令添加到了~/.bashrc文件中而不是/etc/profile文件中，因为这样当我重新开启一个终端时上述命令即可生效，而若是添加到了只有登录式shell才会扫描的/etc/profile文件中，你需要重启电脑才能使上述命令生效。
这里存在的一个问题是：tab命令自动补全只有在使用完整的kubectl命令时才有效，当时用别名时不会有效：这需要改变kubectl completion的输出来修复：
即最终在你的~/.bashrc文件中添加如下内容：
source <(kubectl completion bash | sed s/kubectl/k/g)
现在你可以打开一个新的终端运行下述命令以检查你的tab命令补全是否生效：
kubc<Tab> g<Tab> no<Tab>
k g<Tab> no<Tab>

4.卸载k8s

yum list installed kubernetes
sudo yum erase kubernetes
在这里插入图片描述
Notes
yum remove <packageName>：只删除软件包，而保留配置文件和数据。
yum erase <packageName>：删除软件包和他所有的文件。

5.K3s – a lightweight Kubernetes

由于使用了fedora，我发现了他的一个更轻量级的k8s替代方案：k3s
k3s官方主页：https://fedoramagazine.org/kubernetes-on-fedora-iot-with-k3s/
安装
安装k3s仅需运行一个简单的脚本文件，该脚本文件会自动帮你完成k8s的相关安装部署。
curl -sfL https://get.k3s.io | sh -
在这里插入图片描述
kubectl get node

使用
当上述命令运行结束后，我们就拥有了一个k8s集群。
下面运行一些命令来检查该集群。

kubectl create deployment my-server --image nginx

在这里插入图片描述 kubectl get pods
发现pod的状态一直为正在创建状态，利用
kubectl describe pod <podNAME>
查看pod创建的详细记录
查看其Eevnts部分，该部分给出了pod未创建成功的原因：我们无法访问grc.io
进而还可运行journalctl -f -u docker
在这里插入图片描述无法从google下载相关的镜像，看来我们需要配置国内相关的镜像服务。。。

6.资源的清理工作及删除k3s

资源的清理

首先说一下我们的 创建步骤：

service.yaml
deployment.yaml
核实node以准配好：在master上创建service及deployment之前，需要先检查以下该node是否为ready状态。在大规模的生产集群中，k8s会帮你完成所有的这些检查。
kubectl get node
kubectl create xxx-service.yaml
kubectl create xxx-deployment.yaml
检查service，deployment，pod是否准备好
kubectl get service
kubectl get deploy
kubectl get endpoints
kubectl get pod

删除步骤

首先删除depolymet
kubectl get deploy
kubectl delete <deploy-name>
Notes：注意不要删除pod，由于deployment创建了ReplicaSet，而ReplicaSet如同早期的ReplicationController一样，它们会控制pod的数量，使其一直保持在期望个数内，因此只有删除deployment或是RC才可以删除掉pod。
删除service
kubectl get svc
kubectl delete <svc-name>
检查是否删除
kubectl get pod
kubectl get deploy
kubectl get svc

至此我们已经完成了k3s的初步尝试，接下来我们可以删除k3s，重新装回原来的k8s进行后续在该平台上istio的安装使用

删除k3s

在这里插入图片描述仔细观察安装过程，我们发现了uninstall script /usr/local/bin/k3s-uninstall.sh，卸载脚本文件，一般来说只要执行该文件即可完成相关软件的卸载。

sudo /usr/local/bin/k3s-uninstall.sh
在这里插入图片描述
可以看出该脚本文件最后删除了自身，至此所有的卸载工作均以完成。

二.k8s Notes

1.kubernetes配置文件

配置master和node的服务
在master和node上进行配置是告诉他们如何进行通信，配置文件为：

/etc/etcd/etcd.conf

/etc/kubernetes/

在这里插入图片描述简化单个pod启动的修改：编辑/etc/kubernetes/apiserver文件，将ACL中的AccountService一项去掉。（只是最初测试相关特性时可以这么做）

2.k8s相关问题修复

2.1etcd connection refuse问题修复

相似问题见此：https://www.cnblogs.com/lkun/p/9486156.html

首先利用kubectl get componentstatuses查看集群的组件状态：发现其中的一个etcd出现了如下错误：

etcd-1 Unhealthy Get http://127.0.0.1:4001/health: dial tcp 127.0.0.1:4001: connect: connection refused

在这里插入图片描述这就需要修改etcd的配置文件：

/etc/etcd/etcd.conf

sudo gedit /etc/etcd/etcd.conf
根据出现的相关错误进行如下修改：
在这里插入图片描述
修改完成后重启etcd服务，使之前的改动生效：
sudo systemctl restart etcd
重启完成后，再次利用：
kubectl get componentstatuses
查看组件状态，发现etcd都已经处于健康状态。

在这里插入图片描述

2.2node:no resource found问题修复

安装完一体化的k8s集群后，发现该集群存在许多问题：例如pod长时间不能部署到node上，产看pod的event信息发现：是没有node资源。
当用kubectl get node时，同样可以看到node资源不存在。
在这里插入图片描述
此时就需要利用journalctl工具查看具体的问题到底出现在了哪里。
此时我们可以打开一个新的窗口，开启6个标签页，在每个标签页中分别查看各个服务组件的日志记录。
journalctl -f -u kube-apiserver

5月 02 11:52:05 localhost.localdomain kube-apiserver[1403]: W0502 11:52:05.376790 1403 cacher.go:125] Terminating all watchers from cacher *core.LimitRange
5月 02 11:52:05 localhost.localdomain kube-apiserver[1403]: W0502 11:52:05.400059 1403 reflector.go:270] k8s.io/client-go/informers/factory.go:131: watch of *v1.ServiceAccount ended with: too old resource version: 79057 (107461)
5月 02 11:52:05 localhost.localdomain kube-apiserver[1403]: W0502 11:52:05.411525 1403 reflector.go:270] k8s.io/apiextensions-apiserver/pkg/client/informers/internalversion/factory.go:117: watch of *apiextensions.CustomResourceDefinition ended with: too old resource version: 79057 (107461)
5月 02 11:52:05 localhost.localdomain kube-apiserver[1403]: W0502 11:52:05.413099 1403 reflector.go:270] k8s.io/kubernetes/pkg/client/informers/informers_generated/internalversion/factory.go:130: watch of *core.LimitRange ended with: too old resource version: 79057 (107461)

journalctl -f -u kube-controller-manager

5月 02 14:25:08 localhost.localdomain kube-controller-manager[884]: W0502 14:25:08.511090 884 reflector.go:270] k8s.io/client-go/informers/factory.go:131: watch of *v1beta1.Event ended with: very short watch: k8s.io/client-go/informers/factory.go:131: Unexpected watch close - watch lasted less than a second and no items received

journalctl -f -u kube-scheduler

5月 02 16:25:28 localhost.localdomain kubelet[1534]: I0502 16:25:28.433124 1534 kubelet_node_status.go:276] Setting node annotation to enable volume controller attach/detach

journalctl -f -u kubelet

5月 02 16:17:46 localhost.localdomain kubelet[1534]: I0502 16:17:46.492588 1534 kubelet_node_status.go:276] Setting node annotation to enable volume controller attach/detach

journalctl -f -u kube-proxy

5月 01 14:10:01 localhost.localdomain kube-proxy[977]: E0501 14:10:01.953443 977 reflector.go:134] k8s.io/client-go/informers/factory.go:131: Failed to list *v1.Endpoints: Get http://127.0.0.1:8080/api/v1/endpoints?limit=500&resourceVersion=0: dial tcp 127.0.0.1:8080: connect: connection refused

journalctl -fu docker

5月 02 18:04:02 localhost.localdomain dockerd-current[1259]: time=“2019-05-02T18:04:02.926446919+08:00” level=error msg=“Handler for GET /v1.26/images/k8s.gcr.io/pause:3.1/json returned error: No such image: k8s.gcr.io/pause:3.1”

在这里插入图片描述
根据具体的出错信息，修改相关的配置文件，配置文件位于两个部分：

etcd服务的配置文件位于：/etc/etcd/etcd.conf
k8s各个组件的配置文件位于：/etc/kubernetes/目录下

注意：通过journalctl工具，我发现无法获取node资源的一个最最重要的问题就是通过最后对docker服务的检查发现其中的每个pod的pause container为从gcr.io上下载的，而由于屏蔽了中国的访问，故需要我们手动下载缺少的镜像，缺少的pause镜像为3.1版本的在docker hub上进行搜索，我最终找到了一个3.1版本的pause(docker.io/kubernetes/pause 为3.0版本的，故我没有选择该image）
在这里插入图片描述
拉取该镜像：
docker pull rancher/pause-amd64:3.1

修改kubelet的启动参数，使其使用刚刚拉取的镜像，而不是主动从gcr.io拉取。编辑/etc/kubernetes/config文件，增加如下内容

–pod_infra_container_image=docker.io/rancher/pause-amd64:3.1

在这里插入图片描述修改完上述所有配置后，重启docker及各项服务组件。
解决了pause镜像的问题。

相似问题见此：
https://linuxacademy.com/community/posts/show/topic/19040-kubectl-get-nodes-returns-no-resources-found

Kubernetes Notes以及最新的k3s安装介绍

一.快速安装入门

二.k8s Notes

一.快速安装入门

1.docker

2.kubernetes

3.为kubectl配置别名和命令行补全

4.卸载k8s

5.K3s – a lightweight Kubernetes

6.资源的清理工作及删除k3s

资源的清理

删除k3s

二.k8s Notes

1.kubernetes配置文件

/etc/etcd/etcd.conf

/etc/kubernetes/

2.k8s相关问题修复

2.1etcd connection refuse问题修复

/etc/etcd/etcd.conf

2.2node:no resource found问题修复

猜你喜欢