web-dev-qa-db-ja.com

yahoo Financeから複数の株を一度にダウンロードするpython

私はpandasデータリーダーを使用してyahooファイナンスの機能について質問があります。現在、ストックティッカー付きのリストを使用して、次の行で実行しています。

import pandas_datareader as pdr
import datetime

stocks = ["stock1","stock2",....]
start = datetime.datetime(2012,5,31)
end = datetime.datetime(2018,3,1)

f = pdr.DataReader(stocks, 'yahoo',start,end)

昨日から「IndexError:list index out of range」というエラーが表示されます。これは、複数の銘柄を取得しようとした場合にのみ表示されます。

私が考慮しなければならない最近の日に何か変わったことがありますか、あなたは私の問題に対してより良い解決策を持っていますか?

7
ScharcoMolten

Pandas DataReader's documentation を読み通すと、複数のデータソースAPIの即時減価償却が発行されました。そのうちの1つはYahoo! Financeです。

v0.6.0(2018年1月24日)

Yahoo!Google OptionsおよびQuotesおよび[〜#〜] edgar [〜#〜]。これらのAPIの背後にあるエンドポイントは根本的に変更されており、既存の読者は完全に書き直す必要があります。ほとんどのYahoo!データの場合、エンドポイントは削除されています。 PDRはこれらの機能を復元したいと考えており、プルリクエストは大歓迎です。

これがIndexErrorを取得している原因(または通常は存在しない他のエラー)の原因である可能性があります。


ただし、別のPythonパッケージがあり、その目的はPandas DataReaderのYahoo! Financeのサポートを修正することです。このパッケージは次の場所にあります。

https://pypi.python.org/pypi/fix-yahoo-finance

彼らのドキュメントによると:

Yahoo!Finance は、履歴データAPIを廃止し、それに依存していた多くのプログラムの動作を停止させました。

fix-yahoo-financeは、Yahoo!からデータをスクレイピングすることにより、問題に対する一時的な修正を提供します。 FinancePandas DataFrame/Panelと同じ形式でpandas_datareader 's get_data_yahoo()

基本的に「ハイジャック」pandas_datareader.data.get_data_yahoo()メソッドにより、fix-yahoo-financeの移植は簡単で、インポートするだけで_fix_yahoo_financeをコードに追加します。

追加する必要があるのはこれだけです:

from pandas_datareader import data as pdr
import fix_yahoo_finance as yf

yf.pdr_override() 

stocks = ["stock1","stock2", ...]
start = datetime.datetime(2012,5,31)
end = datetime.datetime(2018,3,1)

f = pdr.get_data_yahoo(stocks, start=start, end=end)

または、Pandas DataReader:

import fix_yahoo_finance as yf

stocks = ["stock1","stock2", ...]
start = datetime.datetime(2012,5,31)
end = datetime.datetime(2018,3,1)
data = yf.download(stocks, start=start, end=end)
9
abccd

新しいPython YahooFinancialsモジュールとpandas=を使用してこれを行うことができます。財務Webページなので、高速で、古い廃止されたAPIやスクレーパーのようなWebドライバーに依存しません。データはJSONとして返され、在庫のリストを渡すことで一度に必要な数の在庫をプルできます。/indexティッカーでYahooFinancialsクラスを初期化します。

$ pip install yahoofinancials

使用例:

from yahoofinancials import YahooFinancials
import pandas as pd

# Select Tickers and stock history dates
ticker = 'AAPL'
ticker2 = 'MSFT'
ticker3 = 'INTC'
index = '^NDX'
freq = 'daily'
start_date = '2012-10-01'
end_date = '2017-10-01'


# Function to clean data extracts
def clean_stock_data(stock_data_list):
    new_list = []
    for rec in stock_data_list:
        if 'type' not in rec.keys():
            new_list.append(rec)
    return new_list

# Construct yahoo financials objects for data extraction
aapl_financials = YahooFinancials(ticker)
mfst_financials = YahooFinancials(ticker2)
intl_financials = YahooFinancials(ticker3)
index_financials = YahooFinancials(index)

# Clean returned stock history data and remove dividend events from price history
daily_aapl_data = clean_stock_data(aapl_financials
                                     .get_historical_stock_data(start_date, end_date, freq)[ticker]['prices'])
daily_msft_data = clean_stock_data(mfst_financials
                                     .get_historical_stock_data(start_date, end_date, freq)[ticker2]['prices'])
daily_intl_data = clean_stock_data(intl_financials
                                     .get_historical_stock_data(start_date, end_date, freq)[ticker3]['prices'])
daily_index_data = index_financials.get_historical_stock_data(start_date, end_date, freq)[index]['prices']
stock_hist_data_list = [{'NDX': daily_index_data}, {'AAPL': daily_aapl_data}, {'MSFT': daily_msft_data},
                        {'INTL': daily_intl_data}]


# Function to construct data frame based on a stock and it's market index
def build_data_frame(data_list1, data_list2, data_list3, data_list4):
    data_dict = {}
    i = 0
    for list_item in data_list2:
        if 'type' not in list_item.keys():
            data_dict.update({list_item['formatted_date']: {'NDX': data_list1[i]['close'], 'AAPL': list_item['close'],
                                                            'MSFT': data_list3[i]['close'],
                                                            'INTL': data_list4[i]['close']}})
            i += 1
    tseries = pd.to_datetime(list(data_dict.keys()))
    df = pd.DataFrame(data=list(data_dict.values()), index=tseries,
                      columns=['NDX', 'AAPL', 'MSFT', 'INTL']).sort_index()
    return df

一度に複数の株価データの例(ティッカーごとにJSONオブジェクトのリストを返します):

from yahoofinancials import YahooFinancials

tech_stocks = ['AAPL', 'MSFT', 'INTC']
bank_stocks = ['WFC', 'BAC', 'C']

yahoo_financials_tech = YahooFinancials(tech_stocks)
yahoo_financials_banks = YahooFinancials(bank_stocks)

tech_cash_flow_data_an = yahoo_financials_tech.get_financial_stmts('annual', 'cash')
bank_cash_flow_data_an = yahoo_financials_banks.get_financial_stmts('annual', 'cash')

banks_net_ebit = yahoo_financials_banks.get_ebit()
tech_stock_price_data = tech_cash_flow_data.get_stock_price_data()
daily_bank_stock_prices = yahoo_financials_banks.get_historical_stock_data('2008-09-15', '2017-09-15', 'daily')

JSON出力の例:

コード:

yahoo_financials = YahooFinancials('WFC')
print(yahoo_financials.get_historical_stock_data("2017-09-10", "2017-10-10", "monthly"))

JSONリターン:

{
    "WFC": {
        "prices": [
            {
                "volume": 260271600,
                "formatted_date": "2017-09-30",
                "high": 55.77000045776367,
                "adjclose": 54.91999816894531,
                "low": 52.84000015258789,
                "date": 1506830400,
                "close": 54.91999816894531,
                "open": 55.15999984741211
            }
        ],
        "eventsData": [],
        "firstTradeDate": {
            "date": 76233600,
            "formatted_date": "1972-06-01"
        },
        "isPending": false,
        "timeZone": {
            "gmtOffset": -14400
        },
        "id": "1mo15050196001507611600"
    }
}
5
alt777

yahooがフォーマットを変更したため、yahoo_financeは使用できなくなりました。fix_yahoo_financeはデータをダウンロードするのに十分です。ただし、解析するには他のライブラリが必要になります。簡単な作業例を次に示します。


import numpy as np #python library for scientific computing
import pandas as pd #python library for data manipulation and analysis
import matplotlib.pyplot as plt #python library for charting
import fix_yahoo_finance as yf #python library to scrap data from yahoo finance
from pandas_datareader import data as pdr #extract data from internet sources into pandas data frame

yf.pdr_override()

data = pdr.get_data_yahoo(‘^DJI’, start=”2006–01–01")
data2 = pdr.get_data_yahoo(“MSFT”, start=”2006–01–01")
data3 = pdr.get_data_yahoo(“AAPL”, start=”2006–01–01")
data4 = pdr.get_data_yahoo(“BB.TO”, start=”2006–01–01")

ax = (data[‘Close’] / data[‘Close’].iloc[0] * 100).plot(figsize=(15, 6))
(data2[‘Close’] / data2[‘Close’].iloc[0] * 100).plot(ax=ax, figsize=(15,6))
(data3[‘Close’] / data3[‘Close’].iloc[0] * 100).plot(ax=ax, figsize=(15,6))
(data4[‘Close’] / data5[‘Close’].iloc[0] * 100).plot(ax=ax, figsize=(15,6))

plt.legend([‘Dow Jones’, ‘Microsoft’, ‘Apple’, ‘Blackberry’], loc=’upper left’)
plt.show()

訪問でき​​るコードの説明については、 https://medium.com/@gerrysabar/charting-stocks-price-from-yahoo-finance-using-fix-yahoo-finance-library-6b690cac5447 =

0
Gerry