• 苗大东:京东基于强化学习的电商搜索排序算法

    导读: 电商场景的搜索排序算法根据用户搜索请求,经过召回、粗排、精排、重排与混排等模块将最终的结果呈现给用户,算法的优化目标是提升用户转化。传统的有监督训练方式...
    大数据 算法 人工智能   2022.05.17 18:31
  • macOS 安装 Nebula Graph 看这篇就够了

    背景 刚学习图数据的内容,当前网上充斥大量的安装文档,参差不齐,部署起来令人十分头疼。 现整理一份比较完整的安装文档,供大家学习参考,本文示例所用 MacBook 采用...
    大数据 机器学习 算法   2022.04.25 13:42
  • Python数据分析--Numpy常用函数介绍(5)--Numpy中的相关性函数

    摘要:NumPy中包含大量的函数,这些函数的设计初衷是能更方便地使用,掌握解这些函数,可以提升自己的工作效率。这些函数包括数组元素的选取和多项式运算等。下面通过实例进行详细了解。 前述通过对某公司股票的收盘价的分析,了解了某些Numpy的一些函数。通常实际中,某公司的股价被另外一家公司的股价紧紧跟随 ...
    大数据   2022-06-01 00:00
  • 数仓血缘关系数据的存储与读写

    一、选择 Nebula 的原因 性能优越 查询速度极快 架构分离,易扩展(目前的机器配置低,后续可能扩展) 高可用(由于是分布式,所以从使用到现在没有出现过宕机情况)...
    大数据 机器学习 算法   2022.05.26 11:25
  • Python数据分析--Numpy常用函数介绍(3)

    摘要:先汇总相关股票价格,然后有选择地对其分类,再计算移动均线、布林线等。 一、汇总数据 汇总整个交易周中从周一到周五的所有数据(包括日期、开盘价、最高价、最低价、收盘价,成交量等),由于我们的数据是从2020年8月24日开始导出,数据多达420条,先截取部分时间段的数据,不妨先读取开始20个交易日 ...
    大数据   2022-05-23 23:59
  • Python数据分析--Numpy常用函数介绍(2)

    摘要:本篇我们将以分析历史股价为例,介绍怎样从文件中载入数据,以及怎样使用NumPy的基本数学和统计分析函数、学习读写文件的方法,并尝试函数式编程和NumPy线性代数运算,来学习NumPy的常用函数。 一、文件读入 :读写文件是数据分析的一项基本技能 CSV(Comma-Separated Valu ...
    大数据   2022-05-21 23:54
  • Databend 全链路追踪

    全链路追踪意味着能够追踪到每一个调用请求的完整调用链路、收集性能数据并反馈异常。Databend 使用 tracing 赋能可观测性,实现全链路追踪。 Databend 与 Tracing 初步...
    大数据 开源   2022.05.18 18:10
  • Python数据分析--工具安装及Numpy介绍(1)

    Anaconda 是一个跨平台的版本,通过命令行来管理安装包。进行大规模数据处理、预测分析和科学计算。它包括近 200 个工具包,大数据处理需要用到的常见包有 NumPy 、 SciPy 、 pandas 、 IPython 、 Matplotlib 、 Scikit-learn 、statsmod ...
    大数据   2022-05-19 23:58
  • BIGO 的数据管理与应用实践

    本文整理自 BIGO 在 nMeetp 上的主题分享,主要介绍 BIGO 过去一年在数据管理建设方面的理解和探索。而 BIGO 数据管理的核心重点在于元数据平台的建设,用以支撑上层数据管...
    大数据 机器学习   2022.04.25 19:32
  • 一文带你了解 「图数据库」Nebula 的存储设计和思考

    在上次的 nebula-storage on nLive 直播中,来自 Nebula 存储团队的负责人王玉珏(四王)同大家分享了 nebula storage 这块的设计思考,也解答了一些来自社区小伙伴的提问...
    大数据 机器学习 算法   2022.05.13 17:51
  • 消息队列与快递柜之间的奇妙关系

    提到消息队列可能一些朋友经常听别人说起一些名词,比如:服务程序解耦,处理流量削峰,通过异步处理提升用户体验,缓冲批处理提高处理性能。笔者擅于白话解说,所以我就不...
    大数据   2022.04.27 07:23
  • 大数据在车联网行业的实践与应用

    **导读:**联友科技是一家旨在提供在汽车行业全价值链解决方案的科技公司。公司以数字化、智能零部件以及智能网联为三大核心业务领域,涵盖研发/制造/营销等领域的信息化产...
    大数据 算法 人工智能   2022.05.03 15:41
  • 深度学习入门笔记:感知机

    定义 感知机接收多个输入信号,输出一个信号。感知机的信号只有1/0两种取值,0对应“不传递信号”,1对应“传递信号”。 x 1 ,x 2 是输入信号。 y是输出信号。 w 1 、w 2...
    大数据 机器学习 人工智能   2022.05.06 17:14
  • 主流开源分布式图计算框架 Benchmark

    1. 前言 近年来,深度学习和知识图谱技术发展迅速,相比于深度学习的“黑盒子”,知识图谱具有很强的可解释性,在搜索推荐、智能助理、金融风控等场景中有着广泛的应用。美...
    大数据 机器学习 算法   2022.05.09 15:53
  • TiDB Cloud GA,助力全球企业在云上构建新一代云原生应用

    PingCAP 宣布 TiDB Cloud 正式商用,助力全球企业在云上构建新一代云原生应用。企业用户可以借助 TiDB Cloud 全托管数据库服务轻松支撑各类创新业务场景,将企业从后台的基...
    大数据   2022.05.12 11:42
  • 可靠分布式系统- paxos 的直观解释

    前言 paxos 是什么? 在分布式系统中保证多副本数据强一致的算法。 paxos 有啥用? 没有 paxos 的一堆机器, 叫做分布式; 有 paxos 协同的一堆机器, 叫分布式系统。...
    大数据 算法   2022.05.13 17:39
  • Springboot2.x整合ElasticSearch7.x实战(一

    学习一个新技术,最快的掌握方式就是先学会使用,让我们有了很强的满足感,在研究底层代码。 本篇幅是继上一篇[Springboot2.x整合ElasticSearch7.x实战目录],适合初学 El...
    大数据   2022.06.02 10:15