web-dev-qa-db-ja.com

ハイパーリンクされたセルからリンクテキストとURLを抽出する

セルA1にハイパーリンクがあるとします:=hyperlink("stackexchange.com", "Stack Exchange")

シートの他の場所で、A1からリンクテキストとURLを別々に取得する数式を作成したいと思います。リンクテキストだけを取得する方法を見つけました。

=""&A1 

(空の文字列との連結)。これにより、リンクされていない「スタック交換」が返されます。

URL(stackexchange.com)を取得する方法は?

17
user79865

Rubén's answer を見た後、次の機能を備えたこのタスク用に別のカスタム関数を作成することにしました。

  1. パラメーターは、文字列としてではなく、範囲として提供されます。つまり、=linkURL(C2)ではなく=linkURL("C2")です。これは、パラメーターが通常どのように機能するかと一貫しており、参照をより堅牢にします。誰かが先頭に新しい行を追加した場合、それらは維持されます。
  2. 配列がサポートされています:=linkURL(B2:D5)は、この範囲で見つかったすべてのhyperlinkコマンドのURL(および他の場所の空白セル)を返します。

1を達成するには、シートから渡される引数(ターゲットセルのテキストコンテンツ)を使用せず、代わりに式=linkURL(...)自体を解析し、そこから範囲表記を抽出します。

/** 
 * Returns the URL of a hyperlinked cell, if it's entered with hyperlink command. 
 * Supports ranges
 * @param {A1}  reference Cell reference
 * @customfunction
 */
function linkURL(reference) {
  var sheet = SpreadsheetApp.getActiveSheet();
  var formula = SpreadsheetApp.getActiveRange().getFormula();
  var args = formula.match(/=\w+\((.*)\)/i);
  try {
    var range = sheet.getRange(args[1]);
  }
  catch(e) {
    throw new Error(args[1] + ' is not a valid range');
  }
  var formulas = range.getFormulas();
  var output = [];
  for (var i = 0; i < formulas.length; i++) {
    var row = [];
    for (var j = 0; j < formulas[0].length; j++) {
      var url = formulas[i][j].match(/=hyperlink\("([^"]+)"/i);
      row.Push(url ? url[1] : '');
    }
    output.Push(row);
  }
  return output
}
9
user79865

簡潔な答え

カスタム関数を使用して、セル式内の引用符付き文字列を取得します。

コード

Yisroel Techが comment で共有する外部投稿には、アクティブな範囲の各数式を、対応する数式の最初の引用文字列で置き換えるスクリプトが含まれています。以下は、そのスクリプトのカスタム関数としての適応です。

/** 
 * Extracts the first text string in double quotes in the formula
 * of the referred cell
 * @param {"A1"}  address Cell address.
 * @customfunction
 */
function FirstQuotedTextStringInFormula(address) {
  // Checks if the cell address contains a formula, and if so, returns the first
  // text  string in double quotes in the formula.
  // Adapted from https://productforums.google.com/d/msg/docs/ymxKs_QVEbs/pSYrElA0yBQJ

  // These regular expressions match the __"__ prefix and the
  // __"__ suffix. The search is case-insensitive ("i").
  // The backslash has to be doubled so it reaches RegExp correctly.
  // https://developer.mozilla.org/en-US/docs/JavaScript/Reference/Global_Objects/RegExp

  if(address && typeof(address) == 'string'){

    var prefix = '\\"';
    var suffix = '\\"';
    var prefixToSearchFor = new RegExp(prefix, "i");
    var suffixToSearchFor = new RegExp(suffix, "i");
    var prefixLength = 1; // counting just the double quote character (")

    var ss = SpreadsheetApp.getActiveSpreadsheet();
    var cell, cellValue, cellFormula, prefixFoundAt, suffixFoundAt, extractedTextString;

    cell = ss.getRange(address);
    cellFormula = cell.getFormula();

    // only proceed if the cell contains a formula
    // if the leftmost character is "=", it contains a formula
    // otherwise, the cell contains a constant and is ignored
    // does not work correctly with cells that start with '=
    if (cellFormula[0] == "=") {

      // find the prefix
      prefixFoundAt = cellFormula.search(prefixToSearchFor);
      if (prefixFoundAt >= 0) { // yes, this cell contains the prefix
        // remove everything up to and including the prefix
        extractedTextString = cellFormula.slice(prefixFoundAt + prefixLength);
        // find the suffix
        suffixFoundAt = extractedTextString.search(suffixToSearchFor);
        if (suffixFoundAt >= 0) { // yes, this cell contains the suffix
          // remove all text from and including the suffix
          extractedTextString = extractedTextString.slice(0, suffixFoundAt).trim();

          // store the plain hyperlink string in the cell, replacing the formula
          //cell.setValue(extractedTextString);
          return extractedTextString;
        }
      }
    } else {
      throw new Error('The cell in ' + address + ' does not contain a formula');
    }
  } else {
    throw new Error('The address must be a cell address');
  }
}
3
Rubén

セルを想定hasハイパーリンク関数;

=hyperlinkを見つけて、「ハイパーリンク」または「xyz」に置き換えてください。

次に、データクリーニングを行ってそれらを分離する必要があります。列への分割テキストまたは=split関数を使用してみてください。どちらも,を区切り文字として使用します。

再度" [二重引用符]を[なし]に置き換えます

このようにもっと簡単に思えます。

2
Jeet Shah