Меню Закрыть

Sas base что это

Содержание

SAS
Тип Частная компания
Основание 1976
Прежние названия SAS Institute Inc.
Основатели Энтони Барр,
Джеймс Гуднайт,
Джон Солл,
Джейн Хельвиг
Расположение США Кэри, Северная Каролина
Ключевые фигуры Джеймс Гуднайт, CEO
Отрасль Программное обеспечение
Продукция BI-системы
Оборот ▲ $2,87 млрд (2012)
Число сотрудников 13 589 (2013)
Дочерние компании SAS Institute (Norway) [d]
Сайт sas.com/russia
Медиафайлы на Викискладе

SAS (ранее SAS Institute Inc.) — американская частная компания, разработчик технологического программного обеспечения и приложений класса Business Intelligence, Data Quality и Business Analytics. Штаб-квартира компании находится в городе Кэри (Северная Каролина), США. Компания основана в 1976 году Энтони Барром (англ. Anthony Barr ), Джеймсом Гуднайтом (англ. James Goodnight ), Джоном Соллом (англ. John Sall ) и Джейн Хельвиг (англ. Jane Helvig ). Изначально название SAS — это аббревиатура от Statistical Analysis System, который со временем стал использоваться в качестве имени собственного для обозначения как самой компании, так и её продуктов, давно уже вышедших за рамки только приложений для статистического анализа.

Содержание

История компании [ править | править код ]

Первый базовый продукт SAS, выпущенный в год основания компании (1976), использовался в основном для статистического анализа данных. Программный пакет состоял из нескольких модулей, которые выполнялись на мейнфреймах IBM. Помимо стандартной для мейнфреймов практики выполнения программ в пакетном режиме, SAS предложил оригинальную для того времени опцию — оконный интерфейс разработки и выполнения программ. Программа писалась в одном окне — Program Editor, результаты её работы отображались в другом — Output, а журналы выводились в третьем — Log.

По мере того, как появлялись другие типы компьютеров, SAS портировала приложения на другие операционные системы.

В 1980 году было открыто первое представительство компании за пределами США — европейский офис SAS, расположенный в Великобритании, позднее этот офис переехал в город Гейдельберг в Германии. В тот же период головной офис обосновался в своём новом кампусе, расположенном на 80 гектарах в городе Кэри, штат Северная Каролина, где и располагается на момент 2011 года.

Джеймс Гуднайт — владелец и CEO компании. Годовой доход компании в 2007 году достиг $2,15 млрд. Представительства компании работают в 109 странах и поддерживают более 45 тыс. клиентов по всему миру. Около 25 % доходов направляется в исследования и разработку продуктов [ источник не указан 3050 дней ] .

Продукты и решения SAS [ править | править код ]

Основные приложения SAS — настраиваемые системы Business Intelligence для финансового менеджмента, управления рисками, маркетинга, управления цепочками поставок. В решениях учитывается отраслевая специфика, поставляются различные решения для разных отраслей.

Все решения базируются на общей технологической платформе (SAS Enterprise Intelligence Platform), которая обеспечивает базовые функциональные возможности, необходимые всем приложениям:

  • ETL/ELT (Extract-Transform-Load/Extract-Load-Transform) — процесс извлечения данных из разнородных источников с последующей их обработкой и очисткой;
  • хранение данных в специализированном аналитическом хранилище данных;
  • формирование и доставка пользователям аналитических отчётов различного уровня сложности’
  • углублённая аналитика — среда для проведения углублённого анализа данных (data mining), описательного и прогнозного моделирования, прогнозирования временных рядов, оптимизации и тому подобных задач.

На основе общей платформы строятся решения SAS для решения задач функциональных направлений бизнеса:

  • управление эффективностью организации (англ. performance management ) включает процессно-ориентированное управление (англ. activity-based management ), составление консолидированной отчётности, бюджетирование и финансовое планирование;
  • анализ клиентской базы (клиентская аналитика) включают управление маркетинговыми кампаниями, автоматизацию кросс-продаж, поведенческую сегментацию клиентов;
  • управление маркетинговыми ресурсами;
  • управление рисками (кредитными, операционными, рыночными и др.);
  • борьба с мошенничеством и отмыванием денег;
  • кредитный скоринг;
  • управление цепочками поставок;
  • прогнозирование спроса.

Функциональные решения настраиваются в соответствии с отраслевой спецификой для банков, страховых компаний, провайдеров телекоммуникационных услуг, транспортных, энергетических, промышленных и других компаний.

Финансовые показатели [ править | править код ]

Выручка компании SAS в 2008 — $2,26 млрд (рост на 5,1 %, в 2007 — $2.15 млрд). Выручка SAS в России и странах СНГ в 2008 — $35 млн (рост на 26 %).

На страны региона EMEA (Европа, Ближний Восток и Африка) приходится 45 % общего дохода, на Америку — 43 %, на Азиатско-Тихоокеанский регион — 12 %. При этом доля продаж SAS в странах Центральной и Восточной Европы (CEE) в общем объёме продаж EMEA составляет 10 %.

Из общего объёма продаж SAS в странах Центральной и Восточной Европы (CEE) приходится 34 % на Россию и другие страны СНГ. Они распределены следующим образом: 85% — Россия, 12 % — Казахстан, 2 % — Украина.

По объёму продаж SAS в России странах СНГ лидирует отрасль телекоммуникаций (44 %), затем идет финансовый сектор — банки и страховые компании (29 %), транспорт (15 %) и 12 % приходится на все остальные отрасли.

Доходы SAS в России и странах СНГ складываются из продаж лицензий (первого года и повторных), оказания консультационных услуг и обучения партнеров и клиентов. Доля доходов SAS в России от первичных продаж составила 40 %, от продления лицензий — 35 %, на услуги консалтинга пришлось 23 % и 2 % — на обучение клиентов и партнеров. [1]

Корпоративная культура [ править | править код ]

SAS регулярно занимает первые места в рейтинге 100 лучших работодателей, который каждый год публикует Fortune. В 2013 году компания заняла второе место, поднявшись на одну позицию по сравнению с предыдущим годом и уступая лишь Google [2] .

Текучесть кадров в компании — около 4 % (в целом по отрасли 20 %). К услугам сотрудников компании бесплатный центр здравоохранения, который находится непосредственно на территории компании. Родители маленьких детей имеют возможность посещать педиатра вечером, в выходные и в праздничные дни, а также получать консультации специалистов по телефону. В штаб-квартире SAS действует детский сад на 600 мест, в филиалах родители дошкольников получают соответствующую компенсацию. Сотрудники имеют возможность пользоваться спортивным комплексом площадью 6000 кв. м. У компании есть собственная лига пловцов и гребная команда. Кроме этого действуют программы поддержки здорового образа жизни, кулинарный лагерь, школа мореплавания, школа танцев для отцов с дочерьми, курсы садоводства и многое другое [3] .

SAS Россия/СНГ [ править | править код ]

Представительство компании SAS в России и странах СНГ было открыто в 1996 году и предоставляет российским заказчикам услуги консалтинга, внедрения, обучения и технической поддержки программных продуктов компании.

Среди пользователей SAS в России и СНГ — ОАО «РЖД», МТС, МГТС, Казахтелеком, Министерство финансов и Налоговый Комитет Республики Казахстан, ЦБ РФ, Сбербанк РФ, Газпромбанк, Альфабанк, Райффайзенбанк, ЮниКредит Банк, Ситибанк, Группа ВТБ, GE Consumer Finance, Банк «Возрождение», НП «АТС», Тинькофф банк и др.

С середины 2011 года представительство возглавляет Валерий Панкратов.

История возникновения

Для начала в сотый раз обратимся к рейтингу ресурса TIOBE, дабы отыскать в нём нашего сегодняшнего героя. SAS располагается на “предлидирующем” 21 месте, что, согласитесь, для data-языка великолепный результат. Так что давайте познакомимся с ним поближе.

Итак, Джеймс Гуднайт (James Goodnight) в 1976 году окончил Университет Северной Каролины, тут же приложил свою руку к созданию небольшой аналитической компании SAS Institute и вот уже 40 лет он ее CEO. SAS — аббревиатура от Statistical Analysis System, что полностью описывает основное направление деятельности компании.

Естественно, для того, чтобы эффективно обрабатывать большие потоки информации потребовался не только качественный программный продукт, но и соответствующий язык. И им стал SAS. Изначально это был довольно примитивный набор шаблонных запросов для группировки данных, но со временем SAS стал полноценным и достаточно популярным языком программирования.

В общем-то с этого момента можно было бы смело вести историю языка, программного обеспечения и всей компании, как единого целого, но в 2002 году объявился идеологический конкурент — World Programming System (WPS), который в своей деятельности не просто стал использовать язык SAS, но и разработал для него собственный компилятор и IDE.

Читайте также:  Carfashion щетки стеклоочистителя отзывы

Разумеется, вскоре началась судебная тяжба, которая в итоге создала интересный прецедент для всего IT-сообщества: WPS выиграл суд, доказав, что авторское право не нарушается, если используется синтаксис и функциональность языка, но не используются исходные коды. Таким образом, язык SAS отчасти избежал участи MATLAB, сорвав ярлык “вещи в себе”.

Кстати, сегодня SAS Institute — не просто преуспевающая компания с оборотом в несколько миллиардов долларов в год, но и одно из наиболее привлекательных мест для работы. Так, в 2013 году SAS заняла второе место в рейтинге “привлекательности” компаний США, пропустив вперёд лишь Google.

Краткая справка

Впрочем, оставим дела компании и обратимся непосредственно к языку. Чтобы вы визуально представляли его внешний вид, вот небольшой отрывок кода, содержащий вывод на экран таблицу данных:

PROC PRINT DATA = models NOOBS;
WHERE Type = "Mountain";
FORMAT Price DOLLAR6.;
TITLE "Current Models of Mountain Bicycles";
RUN;

Основным конкурентом SAS является язык R, причём стоит признать, что последний имеет солидное преимущество. Во-первых, он был создан позднее, соответственно избежал многих проблем роста. Во-вторых, и это наверное главный фактор, он бесплатный, в то время как SAS требует дорогое программное обеспечение. Впрочем, давайте взглянем на преимущества и недостатки SAS в сравнении с главным конкурентом.

Простой синтаксис, быстрое обучение “с нуля”;

Отладка кода проходит значительно проще, чем на R;

Интеграция с БД (Oracle/Teradata);

Удобный формат выходных данных (особенно таблиц);

Мощная поддержка со стороны компании SAS;

Многолетний успешный опыт эксплуатации компаниями разной величины, с разными задачами и разным объёмом входных данных. В частности, России SAS используют ОАО “РЖД”, МТС, ЦБ РФ, а также ведущие банки, среди которых Сбербанк, Альфабанк, Тинькофф и многие другие.

Профессиональное использование языка предполагает покупку программного продукта;

Исходники многих исполняемых алгоритмов SAS не являются публичными, следовательно изучение работы языка сильно ограничено;

SAS значительно уступает в производительности R;

С точки зрения объёма кода SAS также зачастую сильно проигрывает (иногда в несколько раз).

При этом надо понимать, что далеко не во всех сферах SAS и R являются прямыми конкурентами. Взгляните на следующее изображение:

Из него отчётливо видно, что в Data Science SAS сильно проигрывает не только R, но и Python. Но вот в анализе данных, предполагающем дальнейшие прогнозы, SAS занимает лидирующую позицию.

Программный продукт

Для того, чтобы оценить степень размаха в прикладных программах, с которым придётся столкнуться желающему освоить SAS в полном объёме, можно посетить официальный раздел с перечислением пакетов заглавной IDE. Впрочем, здесь прослеживается аналогия с уже упомянутым продуктом MATLAB/Simulink, где также имеется большое количество надстроек, но по сути подавляющее большинство из них имеет строгую специализацию. Так что изначально стоит сфокусироваться лишь на 4 следующих:

SAS Visual Analytics — инструмент для визуализации ваших данных;

SAS Enterprise Miner — инструмент для машинного обучения;

Enterprise / Text Miner — пакет надстроек, аналогичный SAS Visual Analytics, но с большим упором на упрощение любых внутренних взаимодействий;

SAS ETS Module — система прогнозирования.

Если вы вдруг сейчас подумали, что возможно стоит прикупить пару из них, то вот стоп-сигнал: SAS Enterprise Miner, к примеру, обходится крупным компаниям более чем в 100 тысяч долларов. Пакет Analytics будет значительно дешевле, около 8,5 тысяч, но разве от этого легче?

Обучение

Впрочем, это не означает, что постигнуть азы SAS невозможно. Компания активно продвигает свой продукт среди студентов, причём абсолютно бесплатно. Достаточно мощную пробную версию SAS University Edition можно скачать перейдя по ссылке.

Также на официальном сайте у вас есть возможность записаться на экспресс-курсы по изучению языка (причём на русском языке). Рекомендуемая длительность обучения в каждом разделе составляет 3 дня, требования и программу можно посмотреть прямо рядом с торжественной кнопкой записи.

В общем, было бы желание.

Работа

Откровенно говоря, получить работу конкретно SAS-специалисту в России будет очень сложно. Как правило, SAS идёт как жирный плюс. но не как основная специализация. Тем не менее, если вам удастся набраться практического опыта работы с SAS хотя бы в течение 2 лет, хотя бы базово освоить SQL, VB и прочие полезности, то вы сможете смело рассчитывать на зарплату не менее 80 тысяч рублей в месяц. Причём речь не только о столице, стоимость программного продукта SAS как бы подсказывает работодателю не экономить в поисках дешёвой рабочей силы. Но, как уже было сказано, нужную вакансию ещё придётся поискать.

Литература

Нет смысла перечислять лучшие иностранные книги по SAS, так как все они собраны в одном месте, прямо на официальном сайте компании. Особое внимание стоит уделить пошаговому самоучителю, описанию возможностей языка и IDE, а также справочнику новичка.

Что касается ресурсов на русском языке, то тут, разумеется, всё значительно сложнее, но кое-что всё же есть. Помимо официального сайта, лекции Дмитрия Звежинского помогут тем, кто пока не познал английский язык на хорошем уровне, на официальные курсы записывать не хочет, но SAS изучить отчаянно желает.

На этом краткое знакомство считаем оконченным. А вы сталкивались когда-нибудь с языком SAS? Какие впечатления?

Когда мы произносим словосочетание “язык программирования”, в первую очередь, представляем прикладной язык для создания приложений, вроде Java или C#. Но в современном мире с его бесконечно растущими IT-потребностями ничуть не меньшую роль начинают играть языки совершенно другого рода, направленные на анализ и обработку гигантских массивов данных. И SAS — как раз один из таких языков.

История возникновения

Для начала в сотый раз обратимся к рейтингу ресурса TIOBE, дабы отыскать в нём нашего сегодняшнего героя. SAS располагается на “предлидирующем” 21 месте, что, согласитесь, для data-языка великолепный результат. Так что давайте познакомимся с ним поближе.

Итак, Джеймс Гуднайт (James Goodnight) в 1976 году окончил Университет Северной Каролины, тут же приложил свою руку к созданию небольшой аналитической компании SAS Institute и вот уже 40 лет он ее CEO. SAS — аббревиатура от Statistical Analysis System, что полностью описывает основное направление деятельности компании.

Естественно, для того, чтобы эффективно обрабатывать большие потоки информации потребовался не только качественный программный продукт, но и соответствующий язык. И им стал SAS. Изначально это был довольно примитивный набор шаблонных запросов для группировки данных, но со временем SAS стал полноценным и достаточно популярным языком программирования.

В общем-то с этого момента можно было бы смело вести историю языка, программного обеспечения и всей компании, как единого целого, но в 2002 году объявился идеологический конкурент — World Programming System (WPS), который в своей деятельности не просто стал использовать язык SAS, но и разработал для него собственный компилятор и IDE.

Разумеется, вскоре началась судебная тяжба, которая в итоге создала интересный прецедент для всего IT-сообщества: WPS выиграл суд, доказав, что авторское право не нарушается, если используется синтаксис и функциональность языка, но не используются исходные коды. Таким образом, язык SAS отчасти избежал участи MATLAB, сорвав ярлык “вещи в себе”.

Кстати, сегодня SAS Institute — не просто преуспевающая компания с оборотом в несколько миллиардов долларов в год, но и одно из наиболее привлекательных мест для работы. Так, в 2013 году SAS заняла второе место в рейтинге “привлекательности” компаний США, пропустив вперёд лишь Google.

Краткая справка

Впрочем, оставим дела компании и обратимся непосредственно к языку. Чтобы вы визуально представляли его внешний вид, вот небольшой отрывок кода, содержащий вывод на экран таблицу данных:

PROC PRINT DATA = models NOOBS;
WHERE Type = "Mountain";
FORMAT Price DOLLAR6.;
TITLE "Current Models of Mountain Bicycles";
RUN;

Читайте также:  Мощный компьютер работает медленно

Основным конкурентом SAS является язык R, причём стоит признать, что последний имеет солидное преимущество. Во-первых, он был создан позднее, соответственно избежал многих проблем роста. Во-вторых, и это наверное главный фактор, он бесплатный, в то время как SAS требует дорогое программное обеспечение. Впрочем, давайте взглянем на преимущества и недостатки SAS в сравнении с главным конкурентом.

Простой синтаксис, быстрое обучение “с нуля”;

Отладка кода проходит значительно проще, чем на R;

Интеграция с БД (Oracle/Teradata);

Удобный формат выходных данных (особенно таблиц);

Мощная поддержка со стороны компании SAS;

Многолетний успешный опыт эксплуатации компаниями разной величины, с разными задачами и разным объёмом входных данных. В частности, России SAS используют ОАО “РЖД”, МТС, ЦБ РФ, а также ведущие банки, среди которых Сбербанк, Альфабанк, Тинькофф и многие другие.

Профессиональное использование языка предполагает покупку программного продукта;

Исходники многих исполняемых алгоритмов SAS не являются публичными, следовательно изучение работы языка сильно ограничено;

SAS значительно уступает в производительности R;

С точки зрения объёма кода SAS также зачастую сильно проигрывает (иногда в несколько раз).

При этом надо понимать, что далеко не во всех сферах SAS и R являются прямыми конкурентами. Взгляните на следующее изображение:

Из него отчётливо видно, что в Data Science SAS сильно проигрывает не только R, но и Python. Но вот в анализе данных, предполагающем дальнейшие прогнозы, SAS занимает лидирующую позицию.

Программный продукт

Для того, чтобы оценить степень размаха в прикладных программах, с которым придётся столкнуться желающему освоить SAS в полном объёме, можно посетить официальный раздел с перечислением пакетов заглавной IDE. Впрочем, здесь прослеживается аналогия с уже упомянутым продуктом MATLAB/Simulink, где также имеется большое количество надстроек, но по сути подавляющее большинство из них имеет строгую специализацию. Так что изначально стоит сфокусироваться лишь на 4 следующих:

SAS Visual Analytics — инструмент для визуализации ваших данных;

SAS Enterprise Miner — инструмент для машинного обучения;

Enterprise / Text Miner — пакет надстроек, аналогичный SAS Visual Analytics, но с большим упором на упрощение любых внутренних взаимодействий;

SAS ETS Module — система прогнозирования.

Если вы вдруг сейчас подумали, что возможно стоит прикупить пару из них, то вот стоп-сигнал: SAS Enterprise Miner, к примеру, обходится крупным компаниям более чем в 100 тысяч долларов. Пакет Analytics будет значительно дешевле, около 8,5 тысяч, но разве от этого легче?

Обучение

Впрочем, это не означает, что постигнуть азы SAS невозможно. Компания активно продвигает свой продукт среди студентов, причём абсолютно бесплатно. Достаточно мощную пробную версию SAS University Edition можно скачать перейдя по ссылке.

Также на официальном сайте у вас есть возможность записаться на экспресс-курсы по изучению языка (причём на русском языке). Рекомендуемая длительность обучения в каждом разделе составляет 3 дня, требования и программу можно посмотреть прямо рядом с торжественной кнопкой записи.

В общем, было бы желание.

Работа

Откровенно говоря, получить работу конкретно SAS-специалисту в России будет очень сложно. Как правило, SAS идёт как жирный плюс. но не как основная специализация. Тем не менее, если вам удастся набраться практического опыта работы с SAS хотя бы в течение 2 лет, хотя бы базово освоить SQL, VB и прочие полезности, то вы сможете смело рассчитывать на зарплату не менее 80 тысяч рублей в месяц. Причём речь не только о столице, стоимость программного продукта SAS как бы подсказывает работодателю не экономить в поисках дешёвой рабочей силы. Но, как уже было сказано, нужную вакансию ещё придётся поискать.

Литература

Нет смысла перечислять лучшие иностранные книги по SAS, так как все они собраны в одном месте, прямо на официальном сайте компании. Особое внимание стоит уделить пошаговому самоучителю, описанию возможностей языка и IDE, а также справочнику новичка.

Что касается ресурсов на русском языке, то тут, разумеется, всё значительно сложнее, но кое-что всё же есть. Помимо официального сайта, лекции Дмитрия Звежинского помогут тем, кто пока не познал английский язык на хорошем уровне, на официальные курсы записывать не хочет, но SAS изучить отчаянно желает.

На этом краткое знакомство считаем оконченным. А вы сталкивались когда-нибудь с языком SAS? Какие впечатления?

Привет! Я Анна Добрыченко, преподаватель учебного центра SAS в России: провожу тренинги по программированию на SAS Base, использованию SAS Enterprise Guide и SAS Visual Analytics, участвую в подготовке стажеров. Вся техническая документация и статьи продуктов и решений SAS изложены на английском языке, а локализованного материала в Рунете недостаточно.

Поэтому в нашем блоге на Хабрахабре я расскажу об основах программирования на SAS Base в цикле статей.

Язык SAS Base представляет собой основу большинства этих продуктов и решений SAS, именно ему и будут посвящены статьи. В них я познакомлю с терминологией, типами данных, с которыми работает SAS Base, со структурой кода, написанного на SAS Base, и покажу основные приемы, которые используются при написании программ SAS.

Вводная

Есть несколько вариантов изучить основы программирования на SAS Base.

  1. Прочитать документацию: все решения SAS хорошо задокументированы, чтобы пользоваться ими было легко даже новичку. Все справочники находятся на сайте поддержки. Из плюсов стоит отметить, что найти можно все, что интересует бесплатно, из минусов – долго, и вся информация на английском языке.
  2. Посмотреть бесплатный онлайн-курс в формате e-Learning. Плюсы – все подробно разъясняется с примерами и выполнением практических упражнений, минусы – долго (длительность 24 часа), курс на английском языке. Также можно посмотреть видео SAS на Youtube.
  3. Купить книгу, например, Little SAS Book. Книга знакомит начинающих пользователей с языком SAS Base, содержит практические примеры и упражнения. Но опять же, вся литература, выпускаемая SAS, на английском языке и имеет относительно высокую стоимость. Все книги представлены на официальном сайте SAS в разделе «Обучение», также можно воспользоваться ресурсом Amazon. Но если вы студент и участвуете, например, в нашей стажерской программе, то вам могло повезти и вы получили книгу в подарок, что не может не радовать.
  4. Прочитать наш курс статей, освящающий основы программирования на SAS Base. Эти статьи адресованы новым пользователям SAS, работающим в различных сферах бизнеса, по большому счету для всех, кто собирается проводить анализ данных с помощью решений SAS или писать свои программы на SAS Base.

Я постараюсь познакомить с языком SAS Base на конкретных практических примерах с краткими пояснениями, содержащими минимум технического жаргона.

Добываем инструменты

Научиться программировать на SAS Base можно на бесплатном интерфейсе под названием SAS University Edition или сокращенно SAS UE.

SAS UE — это мощный инструмент, который предоставляется SAS Institute. Пользовательский интерфейс для SAS UE (известный как SAS Studio) основан на web-браузере – это web-клиент. Скачать его можно на сайте SAS абсолютно бесплатно. На ПК SAS UE запускается под виртуальной машиной и требует установки программного обеспечения виртуализации. Для Windows подойдет Oracle VM VirtualBox и Vmware Player. Всю информацию по установке можно изучить вот в этом документе.

При запуске программы или задачи SAS Studio подключается к серверу SAS для обработки кода. Сервер SAS может быть размещен в облачной среде, локальной среде или же на локальном компьютере. После обработки кода результаты возвращаются в SAS Studio в вашем браузере.

SAS Studio поддерживает несколько веб-браузеров: Microsoft Internet Explorer, Apple Safari, Mozilla Firefox, and Google Chrome.

Разбираемся в интерфейсе

Немного о том, как выглядит интерфейс SAS UE.

Слева находится панель навигации, справа – рабочая область. Три основные вкладки рабочей области – «Код», «Журнал», «Результаты».

Читайте также:  Как позвонить на телефон без звука

Справка по синтаксису появляется, как только вы уменьшаете список релевантных ключевых слов. Справка по синтаксису также появляется, если щелкнуть правой кнопкой мыши на ключевое слово в программе и выбрать Syntax Help (Справка по синтаксису).

Можно перейти на страницу документации по той или иной процедуре, кликнув на ссылку «Документация по продукту».

На вкладке «Выходные данные» вы можете увидеть созданные таблицы.

На вкладке «Результаты» вы можете просматривать вывод процедур, создающих отчеты.

Если какая-то часть программы используется часто, ее можно добавить во «Фрагменты кода».

После запуска и выполнения любой, даже самой простой программы рекомендую открывать и просматривать Log. Log является инструментом диагностирования и отладки потенциальных проблем, связанных с вашей программой. Журнал выводит текст запущенной программы, также в нем существует три вида сообщений: примечания, предупреждения и ошибки. Даже если ошибок сразу не видно, рекомендуется вдумчиво изучить Log.

Вы можете открыть справку (SAS Help) и документацию прямо из главной панели инструментов. SAS Studio Help (Справка SAS Studio) для перехода на страницу документации по SAS Studio. Эта веб-страница содержит справку по интерфейсу SAS Studio.

Если вы только начали изучать продукты SAS, то наверняка незнакомы с некоторыми особенностями терминологии, используемой в продуктах компании.

Sas7bdat и данные

Начнем с того, что SAS Base работает только с особым форматом данных, который называется SAS Data Set (набор данных SAS). Но помимо всего прочего SAS является очень гибким инструментом и может считывать практически любые данные, преобразовывая в SAS Data Set. Набор данных SAS представляет собой обычную плоскую таблицу, состоящую из строк и столбцов. Набор данных SAS хранится как файл с расширением .sas7bdat.

С точки зрения традиционной терминологии SAS наборы данных состоят из переменных (variables) и наблюдений (observations). Проведя аналогию с терминологией реляционных баз данных, переменные являются столбцами, а наблюдения – строками.

Рассмотрим на примере описанное выше.

Представленная программа создает таблицу people (сам синтаксис мы рассмотрим позже):

Исходные данные могут иметь различный вид, SAS упростил эту задачу. В SAS существует всего два типа данных числовой (numeric) и символьный (character). В наборе данных people переменные First_Name, Last_Name, Phone_Number имеют символьный тип, а переменная Id – числовой. Стоит отметить, что даты в SAS — это тоже числа.

Данная программа создает набор данных time, содержащий текущие дату, время и дату и время (datetime) в формате SAS:

Возможный вид набора данных представлен ниже:

Все три значения – это даты в формате SAS. Итак, дата в формате SAS – это количество дней, начиная с 01 января 1960 до текущей даты, время в формате SAS – это количество секунд, начиная с полуночи текущей даты, дата и время – это количество секунд, начиная с полуночи 1960 года. Именно в таком виде хранятся даты в формате SAS в наборах данных.

Иногда данные могут быть неполными, как в наборе данных people: в нем отсутствуют некоторые значения. В SAS существует понятие missing – пропущенное значение. По факту, пропущенное значение – это тип значения для переменной, которая не содержит данных для конкретной строки или столбца. По умолчанию SAS записывает недостающее числовое значение в виде точки и отсутствующее значение текстовой переменной в качестве пробела. При сравнении «миссинг» всегда равен «миссингу», при этом в операторах сравнения «миссинг» — самое минимальное значение.

Кроме фактических значений, набор данных SAS имеет такие данные, как тип переменной, длину, имя, ярлыки, форматы, называемые атрибутами набора данных.

Переменные и атрибуты

У переменных в SAS есть ряд атрибутов, давайте познакомимся с некоторыми из них.
Длина переменной — это количество байт, приходящихся на один символ.
Данный код демонстрирует вышеизложенное:

Имена переменных, как и наборов данных, задаются самостоятельно. Есть ряд правил именования переменных SAS:

  1. Имена не должны превышать 32 символов.
  2. Имена должны начинаться только с буквы или символа нижнего подчеркивания.
  3. Имена могут содержать только буквы, цифры или символы нижнего подчеркивания.
  4. В именах переменных нельзя использовать специальные символы, в том числе и пробел.
  5. Имена могут содержать как прописные, так и строчные буквы, так как SAS не чувствителен к регистру при именовании сущностей (переменные, наборы данных, библиотеки и так далее). Обращаться в коде к переменной вы можете в любом регистре. Но! Важно то, что SAS запоминает первое появление названия переменной в программе и при формировании отчета использует именно его.

Формат переменной – это правило визуального преобразования данных в отчете. Важно понимать, что значения в таблице при этом не изменяются. Ниже пример того, как дата и время могут быть представлены в отчете, но в исходной таблице их значения хранятся в виде числа.

В последующих статьях мы подробнее познакомимся с атрибутом формат.

Ярлык переменной используется в отчетах вместо имен переменных. Ярлык может содержать до 256 символов, включая специальные символы, в том числе и знак пробела. В последующих статьях мы рассмотрим, виды ярлыков и как они используются в программном коде, а также приемы, когда в имени переменной может быть использован, например, пробел.

Структура программы SAS Base

Ознакомимся со структурой программы на языке SAS Base.

Все программы SAS состоят всего из двух шагов: шаг PROC и шаг DATA. Шаг DATA предназначен для чтения, преобразования и создания наборов данных SAS, а процедурный шаг PROC в основном – для анализа данных, формирования и печати отчетов. Шаги состоят из операторов. Индикатор окончания шага – это ключевое слово RUN (или, например, QUIT для ряда процедур), также сигналом к завершению шага может быть наличие операторов STOP и ABORT. Шаги могут размещаться в произвольном порядке, компилятор считывает последовательно шаг за шагом. Стоит отметить, что и сами шаги считываются построчно и никак иначе. Разные части программы обмениваются друг с другом данными в виде наборов данных SAS.

Синтаксис SAS Base очень прост, так же как и написание кода.

Пример простейшей программы SAS представлен ниже:

Важным требованием синтаксиса является наличие точки с запятой в конце каждого оператора. Данная программа SAS считывает набор данных ads из библиотеки sasuser (с понятием «библиотека» мы познакомимся в следующей статье), создает новый набор данных new. На следующем шаге мы создаем отчет из нового набора данных.

Стоит отметить, что у SAS Base нет требований к форматированию кода. Вы можете написать код в одну строку и код будет работать. Чтобы отформатировать код в SAS U, нажмите на кнопку «формат кода»:

Хороший тон для программиста – это пояснения к исходному тексту программы. Комментарии не влияют на семантику программы.

В SAS Base есть два вида комментариев:

  • Закомментированный оператор — *оператор;

Как отмечалось ранее, Log необходимо детально изучать. Давайте рассмотрим несколько самых распространенных синтаксических ошибок:

  • Опечатка в ключевом слове data или proc.

В данном случае шаг отработает с предупреждением. В Log мы увидим следующую информацию:

В данном случае run на втором шаге программы будет расценен как параметр оператора proc print.

Ошибка будет выглядеть следующим образом:

  • Непарные кавычки. В SAS Base можно использовать одинарные и двойные кавычки, которые должны быть парными.

При непарных кавычках срабатывает подсветка и в Log заносится в этом случае следующее сообщение (фрагмент Log):

Итак, это кратко об интерфейсе SAS UE, терминологии SAS Base и основных требованиях к синтаксису SAS Base. В следующей статье мы рассмотрим библиотеки SAS и их создание, создание детализированных отчетов, рассмотрим форматирование значений и задание постоянных атрибутов переменным.

Уверена, что работа с SAS окажется интересной и увлекательной. Grow with SAS!

Рекомендуем к прочтению

Добавить комментарий

Ваш адрес email не будет опубликован.