首页
归档
分类
我的书屋
Go Playground
UML
OneAPI
FastGPT
图床
音乐
ChatGPT
Gitlab
PS
影院
关于
1
Query理解和Query改写
2
基于大语言模型(LLM)自主Agent 智能体综述
3
docker push到Harbor私库中报unknown blob错误
4
使用kubeadm搭建k8s集群 - Ubuntu-Server 22.04
5
Ubuntu 22.04 Server 设置静态IP
geekidentity
累计撰写
153
篇文章
累计创建
69
个标签
累计收到
8
条评论
导航
首页
归档
分类
我的书屋
Go Playground
UML
OneAPI
FastGPT
图床
音乐
ChatGPT
Gitlab
PS
影院
关于
目录
搜索
标签搜索
Midjourney
Stable Diffusion
Prompt
ChatGPT
AIGC
TensorFlow快速入门与实战
小马哥讲Spring核心编程思想
Android
软件
Redis
Elasticsearch
WebSocket
Spring Cloud
Spring
Spring Boot
REST API
Web
Spark
word2vec
文本相似度
Gensim
NLP
HTTP
SVM
管理学
Vim
Hadoop
SSH
Nginx
Python
Linux
Linux命令
federation
kubernetes
kops
k8s
大数据
Kafka
maven
JVM
Java
翻译
J2EE
Mybatis Generator
Mybatis
Istio
眼保健操
健康养生
git
梯度下降
导数计算
计算图
sigmoid函数
Logistic
二分分类
监督学习
神经网络和深度学习
深度学习工程师
学习笔记
PostgreSQL
数据库
Apache Beam
语音识别
ASR
Kaldi
AI
Mac
docker
Others
标签
Spark
Spark 介绍
7 年前
1336
0
0
157.6℃
Spark
Spark 技术背景在Spark 之前,大多数集群编程模型(如MapReduce、Dryad等)是基于非循环的数据流模型。即从稳定的物理存储(如HDFS)中加载记录,记录被传入由一组确定性操作构成的DAG(Directed Acyclic Graph,有向无环图),然后写回稳定存储。DAG 数据流图