web-dev-qa-db-ja.com

matplotlibでタイムラインをプロットすることは可能ですか?

このcsvのような値で日付をプロットしようとしています。

Tue  2 Jun 16:55:51 CEST 2015,3
Wed  3 Jun 14:51:49 CEST 2015,3
Fri  5 Jun 10:31:59 CEST 2015,3
Sat  6 Jun 20:47:31 CEST 2015,3
Sun  7 Jun 13:58:23 CEST 2015,3
Mon  8 Jun 14:56:49 CEST 2015,2
Tue  9 Jun 23:39:11 CEST 2015,1
Sat 13 Jun 16:55:26 CEST 2015,2
Sun 14 Jun 15:52:34 CEST 2015,3
Sun 14 Jun 16:17:24 CEST 2015,3
Mon 15 Jun 13:23:18 CEST 2015,1
...

ここで最初の答えと非常によく似た何かをしています: Matplotlibタイムライン

しかし、そのような視覚化を見てデータをよく把握するのは本当に難しいです。次に、期間をプロットしようとしているので、重要なy軸は必要なく、日付と値を含むx軸のみを色にすることができることに気付きました。

このようなもの:

---===-===---****
DDDDDDDDDDDDDDDDD

-=* = type of values (using colors for example, but any representation would do)
D = dates

Matplotlibの例を見ると似たようなものは見られないようです

カラーバーは機能するように見えますが、軸は日付間隔である必要があるため、完全ではありません http://matplotlib.org/examples/api/colorbar_only.html

10
mr_pen

たとえば、定性的なデータなので、空間的なy軸を使用したくないですか?

enter image description here

から:

import matplotlib.pyplot as plt
import pandas as pd

dates = ["Tue  2 Jun 16:55:51 CEST 2015",
"Wed  3 Jun 14:51:49 CEST 2015",
"Fri  5 Jun 10:31:59 CEST 2015",
"Sat  6 Jun 20:47:31 CEST 2015",
"Sun  7 Jun 13:58:23 CEST 2015",
"Mon  8 Jun 14:56:49 CEST 2015",
"Tue  9 Jun 23:39:11 CEST 2015",
"Sat 13 Jun 16:55:26 CEST 2015",
"Sun 14 Jun 15:52:34 CEST 2015",
"Sun 14 Jun 16:17:24 CEST 2015",
"Mon 15 Jun 13:23:18 CEST 2015"]

values = [3,3,3,3,3,2,1,2,3,3,1]

X = pd.to_datetime(dates)
fig, ax = plt.subplots(figsize=(6,1))
ax.scatter(X, [1]*len(X), c=values,
           marker='s', s=100)
fig.autofmt_xdate()

# everything after this is turning off stuff that's plotted by default

ax.yaxis.set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['left'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.xaxis.set_ticks_position('bottom')

ax.get_yaxis().set_ticklabels([])
day = pd.to_timedelta("1", unit='D')
plt.xlim(X[0] - day, X[-1] + day)
plt.show()
13
cphlewis

編集:私はそこに解決策が好きではなかったので、私はPILで自分自身を焼きます:

結果は次のとおりです。

Resulting visualisation

これはコードです:

#!/usr/bin/env python3
from datetime import datetime, timedelta
from dateutil.relativedelta import relativedelta
import csv
import matplotlib.pyplot as plt
import matplotlib.dates as pltdate
from PIL import Image, ImageDraw

lines = []
with open('date') as f:
    lines = list(csv.reader(f))
    frmt = '%a %d %b %X %Z %Y'
    dates = [datetime.strptime(line[0], frmt) for line in lines]
    data = [line[1] for line in lines]

#datesnum = pltdate.date2num(dates)
#fig, ax = plt.subplots()
#ax.plot_date(datesnum, data, 'o')

#plt.show()

#generate image
WIDTH, HEIGHT = 4000, 400
BORDER = 70
W = WIDTH - (2 * BORDER)
H = HEIGHT - (2 * BORDER)


colors = { '0': "Lime", '1' : (255,200,200), '2' : (255,100,100), '3' : (255,0,0) }

image = Image.new("RGB", (WIDTH, HEIGHT), "white")
min_date = dates[0]
max_date = datetime.now()
#print(min_date)
#print(max_date)
interval = max_date - min_date
#print(interval.days)

#draw frame
draw = ImageDraw.Draw(image)
draw.rectangle((BORDER, BORDER, WIDTH-BORDER, HEIGHT-BORDER), fill=(128,128,128), outline=(0,0,0))

#draw circles
circle_w = 10
range_secs = W / interval.total_seconds()
#print(range_secs)
for i in range(len(dates)):
    wat = dates[i] - min_date
    offset_sec = (dates[i] - min_date).total_seconds()
    offset = range_secs * offset_sec
    x = BORDER + offset
    draw.ellipse((x, BORDER + 50, x + circle_w, BORDER + 50 + circle_w), outline=colors[data[i]])
    #draw.text((x, BORDER + 75), str(i), fill=colors[data[i]])

#draw rectangles
range_days = W / (interval.days + 1)
#print("range_days",range_days)
current_date = min_date
date_month = min_date + relativedelta(months=1)
current_index = 0
for i in range(interval.days + 1):
    max_color = '0'
    while dates[current_index].date() == current_date.date():
        if int(data[current_index]) > int(max_color):
            max_color = data[current_index]
        current_index += 1
        if current_index > len(dates) - 1:
            current_index = 0
    x = BORDER + range_days * i
    draw.rectangle((x, BORDER + 100, x+range_days, BORDER + 100 + 50), fill=colors[max_color], outline=(0,0,0))
    if current_date == date_month:
        draw.line((x, BORDER + 100 +50, x, H + BORDER + 20), fill="black")
        draw.text((x, H + BORDER + 20), str(date_month.date()), fill="black")
        date_month = date_month + relativedelta(months=1)
    #draw.text((x, BORDER + 175), str(i), fill=colors[max_color])
    current_date = current_date + timedelta(days=1)

#draw start and end dates
draw.text((BORDER, H + BORDER + 20), str(min_date.date()), fill="black")
draw.text((BORDER + W, H + BORDER + 20), str(max_date.date()), fill="black")

image.save("date.png")
13
mr_pen

broken_barh() APIを使用します。次のようなものです。

mycolors=deque(["#d24e32","#6a40c5","#59ba45",...])        

# for each bar to draw
ax.broken_barh([(x, w), ...], (y, h), color=mycolors, alpha=0.3, antialiased=True)

mycolors.rotate(-1)
0
bobah

探していた答えが見つからなかったので、これが私の見解です。この関数は時系列を取り、範囲内のランダムな正と負の点をプロットします。シリーズを付けることで、グラフにラベルを付けることができ、2番目のシリーズをクリックすると、より多くのデータを表示できます。

#!/usr/bin/python
# -*- coding: utf-8 -*-
import matplotlib.pyplot as plt
import mplcursors
import numpy as np


    # expects series, annotation, and the annotation data to be shown on click

def stimeline(timeseries, annotation, onclick):

    neg = np.random.randint(low=-500, high=0, size=len(timeseries))
    pos = np.random.randint(low=0, high=500, size=len(timeseries))
    i = 0
    d = []
    while i < len(timeseries):
        if i < len(timeseries):
            d.append(pos[i])
            i += 1
        if i < len(timeseries):
            d.append(neg[i])
            i += 1
    (fig, ax) = plt.subplots(figsize=(8.8, 4), constrained_layout=True)
    ax.stem(timeseries, d, basefmt=' ')
    ax.set(title='Timeline')
    ax.set_ylim(-545, 545)

    levels = np.tile(d, int(np.ceil(len(timeseries)
                     / 6)))[:len(timeseries)]
    (markerline, stemline, baseline) = ax.stem(timeseries, levels,
            linefmt='C3-', basefmt='k-')
    plt.setp(markerline, mec='k', mfc='w', zorder=3)
    vert = np.array(['top', 'bottom'])[(levels > 0).astype(int)]
    for (d, l, r, va) in Zip(timeseries, levels, annotation, vert):
        ax.annotate(
            r,
            xy=(d, l),
            xytext=(-3, np.sign(l) * 3),
            textcoords='offset points',
            va=va,
            ha='right',
            )

    ax.get_yaxis().set_visible(False)
    for spine in ['left', 'top', 'right']:
        ax.spines[spine].set_visible(False)

    mplcursors.cursor(ax).connect('add', lambda sel: \
                                  sel.annotation.set_text(onclick[sel.target.index]))

    ax.margins(y=0.1)
    plt.show()