我正在学习一些与数据科学相关的主题,哦,天哪,这是一个各种不同的库的丛林,适用于一切????
因为一些原因,我 Select 了Lets-plot,它有一个很好的Kotlin API和Kotlin kernel for Jupyter notebooks组合在一起
总体而言,事情进展得很好.我在网上看到的大多数教程和文档使用不同的库进行绘制(例如Seaborn、Matplotlib、Plotly),因此大多数情况下我必须阅读Lets-Plot-Kotlin reference并try /出错,直到找到与我的图形相同的代码
目前,我正在try 绘制两个值之间的差异分布图.总体而言,这看起来相当不错.我可以做一些像这样的事情
(letsPlot(df)
+ geomHistogram { x = "some-column" }
).show()
这将是有趣的看到密度估计器以及,geomDensity
救援!
(letsPlot(df)
+ geomDensity(color = "red") { x = "some-column" }
).show()
好的!现在让我们一起来看他们俩
(letsPlot(df)
+ geomDensity(color = "red") { x = "some-column" }
+ geomHistogram() { x = "some-column" }
).show()
如你所见,底部有一条小红线(geomDensity
!).这里的问题(我想说)是这两个层使用相同的Y标度.直方图使用0-20的值和0-0.02的密度,所以当绘制在一起时,它只是底部的一条线
有没有办法在同一个图中添加使用自己比例的几个图层?我读过some blogposts篇文章,声称你不应该这样做(似乎是pretty much accepted by the community篇).
我的目标是通过以下方式实现类似于您在Seborn所能做的事情
plt.figure(figsize=(10,4),dpi=200)
sns.histplot(data=df,x='some_column',kde=True,bins=25)
(是的,我知道我在没有配置垃圾箱的情况下拍摄了LETS情节截图.无关紧要,我会说‘_(ツ)_/’)
也许我只是带着一种我不应该的心态来处理这个问题?正如前面提到的,我还在学习,所以每一种 Select 都会受到高度欢迎,????
只是,请不要使用"切换到Python"这个词.我在探索,我更喜欢一次只研究一个主题