web-dev-qa-db-ja.com

100%アクセス可能であるが「公開されていない」APIからデータを取得するのは(il)legalである方法

ある国の都市に関する最新のデータを含む巨大なフィルター可能なテーブルを提供するWebサイトを見つけました。このサイトは、無限スクロールアプローチを使用して、テーブルの行をロードします。

Chromeのデベロッパーツールを使用してサイトを探索すると、データを取得するために、内部URLに対してAJAXリクエストを行うことがわかりました。このURLには、フィルターに対応する多くのクエリパラメーターが含まれています。

ブラウザでそのURLに直接アクセスしようとしましたが、すべてのデータをNice JSON形式で取得しています。フィルターをいじって、必要な具体的なデータを取得することもできます。このURLは実際にアクセス可能であるため、何もする必要はありませんhacky、私は単にネットにあるURLを呼び出しています。

したがって、私の質問は、自分の目的のためにそのURLを使用してデータを取得することはどの程度合法または違法ですか?

同じ種類の都市リストを作成したくない、しかし、私はそのデータを使用して小さなオンラインゲームを作成し、少しのお金を稼ぐ可能性があります...


重要応答とコメントに関する注意

これは単なる例であり、都市に関するデータを取得する場所を探しているわけではありません。必要に応じて、季節ごとに更新されたサッカー選手のパフォーマンスに関するデータを含むWebサイトを検討してください。

具体的な国については、特定の法律で考えているわけではありません。明確に(不)合法な国を知っているなら、それは有用な情報です。

37
MikO

はっきりさせてください。私がよく知っていることは、著作権法です。私は弁護士ではありませんが、著作権の知識は私のコンサルタントの30年間の一定の要件でした。追加のボーナスとして、私は主に通信事業者に相談し、加入者データとデータ分析、および販売および再利用のための当該データの提示を頻繁に行いました。少なくとも、このフォーラムでこの質問に答える唯一の資格があります。

これについては、できる限り最善の方法で説明します。 2、引用されたケースの例外と他の関連する著作権の考慮事項を定義します。 3つ目は、答えが明確であることです。

著作権の一部を明確にします。電話帳の例は誤った呼び名です。電話を取得すると、民間企業と民間企業として民間契約契約を締結しており、結果として生じる情報は公開されているかどうかにかかわらず、個人所有のデータであるため、電話帳の内容は所有権があります(注意を払ってください)この単語)単純に、会社のデータソース(サブスクライバーデータ)以外の手段では一般に取得できないためです。歩き回って家番号や通りの名前を書き留めるなどの通常の方法でデータを取得できる場合、それは一般に利用可能なデータであり、使用するのは明らかです。これは、通常の手段では電話番号を取得できないということではありません。かもね。

さらに明確にするために。引用元: http://www.lib.umich.edu/copyright/facts-and-data

原作者の著作物の著作権保護は、記述、説明、図解、または具体化された形式に関係なく、アイデア、手順、プロセス、システム、操作方法、概念、原則、または発見に及ぶことはありませんそのような仕事で。

この段落は誤解を招くものです。この段落で説明されているこの例外は、特許法およびその他の法律の対象です。著作権は作品の作成のみに及びます。

「眉の汗」の教義

...家から家へ行ったり、手動でデータを収集したりするなどのアクティビティを指します。これは通常の手段の定義です。ドアをノックして、同じ電話データを要求することができます。通常の方法で事実を収集できる範囲でのみ、そのデータまたは専有データの一部が公開されます。

電話データを使用する通常の方法は次のとおりです。1つは、法的手段を通じて元のデータを取得します。 2つ目は、フェアユースの原則を適用することです。これには、無料または有料の電話帳のコピーを会社から直接入手し、新しい作品を作成するために異なる方法で事実を整理する必要があります。シカゴにいるときにシアトルの電話帳を取得しようとしましたか?電話会社は、驚くほどの料金を請求する可能性が高いでしょう。ただし、シアトルの電話加入者であり、シアトルの電話帳を要求すると、料金ははるかに少なくなり、さらには無料になります。私はこれを何度もしなければなりませんでした。テレコから直接電話帳を入手し、必要に応じて料金を支払うだけの仕事をしている人がいます。

ケースFeist Publications v.Rural Telephoneで引用された判決(この回答では)は、2つの事実に依存しています。1つは、地方独占としての地方の協同組合の運営者は、運営上の合意によって公に利用可能にする必要がありました。 2つ目は、作品のプレゼンテーションは著作権で保護されており、事実#1に含まれる事実ではありません。したがって、狭いパラメーター内でのみ、このケースを先行ケースと見なすことができ、破棄する必要があります。通常、民間企業の加入者データは、公開によって合意される必要はありません。農村協同組合は、公共財のための公共の信託/事業体として設立され、公共および/または協同組合のメンバーによって所有されているため、運営または存在が認められる法的制限の下で運営されていることを覚えておく必要があります。各ケースは異なります。カーブアウト例外の説明なしに引数として上記のケース(リンク先ページ)を引用することは誤解を招きます。

ベル電話会社の初期の頃、会社は、加入者によって制限されない限り、電話データを公開する独占として要求されていました。ベル社がベビーベルズ、ベルアトランティック、ベルサウスなどに分割されたとき、これらの会社は、以前に定義されたように電話データを公開する独占としてまだ必要でした。しかし、規制緩和により、実際にVoIP、セルラー、その他のオプションでは、独占はまれです。上記の議論は独占シナリオでのみ可能です。

上記のリンクを引用し続けます(この回答では):

データが著作権によって保護されていないからといって、他の人のデータセットを使用したいときに、他の法的考慮事項が存在しないという意味ではありません。

これを覚えておいてください。

特定のデータセットとそのプレゼンテーションは、データの起点に関係なく、それ自体が作業です。手段に関係なく、事実を公開することはそれ自体の仕事です。

データが公開されていても、通常の方法でデータを取得していないことを考えると、データの元の起源に関係なく、あなたが説明したように自由に使用できず、刑事責任を問われ、民事責任を問われる可能性があります犯罪の不法侵入や、通常許可されていないコンピュータやその他の通信機器の違法な使用に対する潜在的な著作権侵害、およびRICO法の対象となる可能性があります。

使用することは合法ですか?いや!絶対違う!通常の方法で取得されたものではなく、Webサイト運営者が専有データを公開する意図もありません。 AUP(利用規定)がない場合は役に立ちません。この場合、ウェブサイトの所有者を保護する「合理的な男性」、「合理的な基準」、および「合理的な仮定」に関して、法律の下でなされた仮定があります。賢い人がWebサイトの「設計/作成の脆弱性」を使用して他の用途のデータを取得することは合理的ではありません。同様に、サイトがその活動から利益を得る場合、さらなる保護が作用します。

27
closetnoc

ここの他の答えではあまり明確ではないように思われる1つのこと...

「合法」であるかどうかは、何よりもまず国によって異なります。たとえば、米国について話している場合、データ自体の使用は違法ではありません。ただし、米国国勢調査のrealデータを使用することをお勧めします。 TIGER製品と呼ばれるものを通じて、大量のデータを提供します。このデータセットは、GISの専門家がBingマップ、Googleマップなどを作成するために使用するものと同じデータセットです。

ただし、データは自由に利用できますが、それは必ずしもこの公開されたAPIからのデータが合法的に利用できることを意味するわけではありません。あなたはそれがJSON形式であると言います、それはそれが元の形式からこの形式に「マッサージ」されたことを示唆します-そして、そのカスタム形式は知的財産に分類されるかもしれませんThatは、使用するライセンスを持っていない限り、使用することは違法だと思います。ここの他の人たちと同じように、私は弁護士ではありませんが、会社はあなたを指差してハッカーと呼ぶ必要さえありません。所有権のあるデータは、意図せずに配布された場合でも、所有権のあるデータです。会社に連絡して、このデータのすべてが外部に公開されていることを伝え、使用する許可を求める必要があります。それをせずに、証拠としてスタック交換でこの質問をすることによって、あなたに対するケースを構築するのは簡単です。あなたは本質的に「これは合法ではないように見えますが、私はとにかくそれが好きで、私はそれからお金をもうけたいです」繰り返しますが、私は弁護士ではありませんが、それは裁判を始めるための素晴らしい方法のようには見えません。

ただし、都市名やその他の地理データに興味がある場合は、国に関係なく、ほとんどすべてを自由に利用できます。最後に私が知っていたのは、米国が最も多くのデータを公開していることですが、事実上すべての国にデータがあります。私がプログラマーだからといってすべてを言うのはためらっています。「万人のための」声明を証明するのは難しいです。特定の国を念頭に置いている場合は、 GIS Stack Exchange に進んでください。探している主なものは「シェープファイル」と呼ばれるので、「__________のシェープファイルはどこで入手できますか?」などの質問をしてください。 OpenStreetMap もあり、これはオープンソースのマップです。シェープファイルデータを取得するのがどれほど簡単かはわかりませんが、シェープファイルデータを取得できる場合は(そして、なぜできないのかわからないので、ローカルに基づいてオフラインマップを実行できます保存された情報)、必要なすべてのデータがあり、合法的に平文です。膨大な量のデータを必要なものまでマッサージするのに時間を費やす必要がありますが、シェープファイルは常に非常に明確に定義されており、解析が容易です。

6
Shaz

Closetnocはデータ自体の問題について議論していますが、より大きな法的懸念があります。データを提供するAPIにアクセスする権限がありません。

ほとんどのコンピューター犯罪法のベースラインには、「コンピューターシステムへの不正アクセス」という概念が含まれます。アクセス制御に関しては、法的な意味での認可へのこの参照を認可の概念と混同しないでください。システムの所有者は、notにアクセスできないようにシステムを保護する必要があります。ロック解除されたドア。

この場合、セキュリティの明らかな欠如は、それを使用する許可を意味するものではありません。これまでのところ、インターネットの概念は判例法ではほとんど先例がありませんが、HTTP 80プロトコルを使用してWebサイトを閲覧するための公的な許可を暗示することを想像できます。反対に、バックグラウンドRPCプロトコル(HTTP要求で実行される場合でも)は、通常、オペレーターがサービスを公開し、サードパーティに使用許可を付与しない限り、一般に利用可能であるとは理解されません。

したがって、APIを継続して使用してデータを取得することは違法です。 APIからデータダンプを取得して独自のデータセットを作成する行為も違法です。その後のデータの使用が違法かどうかは巨大な灰色の領域ですが、closetnocはほとんどの懸念をカバーしています。

もちろん、認識できないという事実の後にデータダンプを変更すると、犯罪を犯したことを証明することはほとんど不可能になります。しかし、あなたがそのような多くの問題を抱えているなら、代わりに合法的なソースからデータを入手しないのはなぜですか?

5
Lilienthal

おそらくデータの性質に依存します。 純粋なデータ(電話帳など)は著作権で保護されていません 。したがって、APIからの都市のリストは、コピーしてユーザーに表示するのに公平なゲームである必要があります。ただし、そのAPIに都市の説明がある場合、それらの説明は著作権法に該当し、著作権に違反することなくそれらを使用することはできません。

データを合法的にコピーできる場合は、APIの使用が途中でシャットダウンされないように、自分のサイトにコピーすることをお勧めします。

4

(IANAL、および法律と規範は世界中で大きく異なりますが、特定の事柄はIP条約により一貫性を保つ傾向があります。専門外の専門的な問題がある場合は、専門家に相談してください。)

一般的に、法的に、APIは、指定された利用規約でasパブリックAPIとして積極的に文書化されていない限り、「パブリック消費向け」とは見なされません。公衆がAPIにアクセスできるという事実は、APIを公開しません。

データ自体のステータスが明らかにパブリックドメインではない場合、および明確にisパブリックドメインであるいくつかのケースでは、APIを提供するエンティティの意図が非常に重要です。ウェブサイトの運営者がAPIを使用して動的なウェブページまたはモバイルアプリケーション(一般的な例を2つ挙げる)を提供することを意図している場合any他で特に許可されない限り、他の使用は「無許可」です。意図した消費者が特定のWebページの動的コードのスニペットであった場合、特定の(願わくば)快適で便利な方法で人間が理解できるピクセルをディスプレイに配置する目的で、any other usage is無許可。

何も開けたり壊したりせずに開いた窓から建物に入る技術的能力は、犯罪の不法侵入で逮捕されるのを防ぎません...

また、知的財産弁護士と「技術的能力」対「オリジナルの意図」のゲームをプレイすることはほとんど賢明ではありません。それ以外の場合は、一貫してこれらのケースを失った弁護士は彼らのために支払われ続けないことを覚えておいてください。

3
Robert

あなたが話していることはおそらく大丈夫です。情報にハイパーリンクしてから変換します。

Perfect 10、Inc. v。Amazon.com、Inc. [19]では、第9巡回区は、画像検索エンジンのサムネイルの使用が公正使用であるかどうかを再度検討しました。事実はアリバ・ソフト事件よりも多少近かったが、それにもかかわらず、裁判所は、それが「高度に変革的」だったので、被告人の使用フェアを認定した。裁判所は説明した:

Googleの検索エンジンの非常に変革的な性質は、特に公共の利益に照らして、この場合のGoogleのサムネイルの置き換えおよび商業的使用を上回ると結論付けます。 …また、「新しい作品がより変容的になればなるほど、フェアユースの認定に反する商業主義のような他の要因の重要性は低くなる」という最高裁判所の指示にも留意している。

さらに、裁判所は、リンクを行う最初の米国上訴決定において、リンクの著作権の状態を具体的に取り上げました。

Googleは、Googleがユーザーのコンピューター画面に表示されるインラインリンク画像をフレーム化する場合、著作権法の目的でフルサイズの著作権侵害の写真画像のコピーを表示しません。 Googleのコンピューターには写真の画像が保存されていないため、Googleは著作権法の目的で画像のコピーを所有していません。言い換えると、Googleには「作品が固定されている…そして作品を知覚、複製、または他の方法で伝達できる物質」がないため、コピーを伝達できません。コピーを伝達する代わりに画像のGoogleは、フルサイズの写真画像を保存するWebサイト発行者のコンピューターにユーザーのブラウザーを誘導するHTML命令を提供します。これらのHTML指示を提供することは、コピーを表示することと同等ではありません。まず、HTMLの指示は写真の画像ではなく、テキストの行です。第二に、HTML命令自体は、侵害画像をユーザーのコンピューター画面に表示させません。 HTMLは、単にユーザーのブラウザに画像のアドレスを提供するだけです。その後、ブラウザは侵害画像を保存するコンピューターと対話します。この相互作用により、侵害画像がユーザーのコンピューター画面に表示されます。 Googleは、侵害画像へのユーザーのアクセスを促進する場合があります。ただし、そのような支援は寄与責任問題のみを提起し、著作権所有者の表示権の直接侵害を構成するものではありません。 …インラインリンクとフレーミングにより、一部のコンピューターユーザーは単一のGoogle Webページを表示していると信じることがありますが、著作権法は商標法とは異なり、消費者の混乱を引き起こす行為から著作権者を保護しません。

Arriba Soft and Perfect 10後の米国法の状態

Arriba Soft事件は、縮小版コピーでのディープリンクと実際の複製(または縮小版派生作品の作成)の両方が被告の作品の使用が実際にまたは潜在的に最初の作業から市場での貿易を迂回させます。また、以前は利用できなかった、著作権法が促進する種類の非常に便利な機能を一般に提供しました(Webで必要な情報を見つける)。 Perfect 10の場合も同様の考慮事項が関係していましたが、利益のバランスを取ることが関係していました。他の方法では利用できない有用な機能の公衆への価値が、Googleのおそらく代替的な使用のPerfect 10への影響を上回るため、この行為は免除されました。

さらに、Perfect 10では、裁判所はリンクとフレーミングを支持する広範囲な先例を定め、著作権の下で完全なパスを与えました。 It 「インラインリンクとフレーミングにより、一部のコンピューターユーザーは単一のGoogleウェブページを閲覧していると信じることがありますが、著作権法は、消費者の混乱を引き起こす行為から著作権者を保護しません。」

強調鉱山。 リンク

ハイパーリンクを使用しているだけで、コピーを作成していない、コピーを表示していない、ビジネス上の利益を害していない、非常に変換している。私はあなたがうまくいくために必要なすべての要素を持っていると思います。しかし、IANAL。

2
Shane